其他教程

其他教程

Products

当前位置:首页 > 其他教程 >

python正则表达式问题

GG网络技术分享 2025-03-18 16:15 1


问题描述:

请问怎么用正则表达式表示百度搜索出的网页标题(图中划出的这类标题)

网友观点:

1.通过ctrl+u 找到其源代码

  1. 得到这个json后进行获取即可

可以用爬虫

python re正则表达式问题列表

一.re.escape

re.escape(pattern) 可以对字符串中所有可能被解释为正则运算符的字符进行转义的应用函数。如果字符串很长且包含很多特殊技字符,而你又不想输入一大堆反斜杠,或者字符串来自于用户(比如通过raw_input函数获取输入的内容),且要用作正则表达式的一部分的时候,可以使用这个函数.

二.re.compile

1. 使用re.compile

re模块中包含一个重要函数是compile(pattern [, flags]) ,该函数根据包含的正则表达式的字符串创建模式对象。可以实现更有效率的匹配。在直接使用字符串表示的正则表达式进行search,match和findall操作时,python会将字符串转换为正则表达式对象。而使用compile完成一次转换之后,在每次使用模式的时候就不用重复转换。当然,使用re.compile()函数进行转换后,re.search(pattern, string)的调用方式就转换为 pattern.search(string)的调用方式。

其中,后一种调用方式中,pattern是用compile创建的模式对象。如下:

>>> import re

>>> some_text = 'a,b,,,,c d'

>>> reObj = re.compile('[, ]+')

>>> reObj.split(some_text)

['a', 'b', 'c', 'd']

2.不使用re.compile

在进行search,match等操作前不适用compile函数,会导致重复使用模式时,需要对模式进行重复的转换。降低匹配速度。而此种方法的调用方式,更为直观。如下:

>>> import re

>>> some_text = 'a,b,,,,c d'

>>> re.split('[, ]+',some_text)

['a', 'b', 'c', 'd']

三.re中findall和finditer

python正则模块re中findall和finditer两者相似,但却有很大区别。
两者都可以获取所有的匹配结果,这和search方法有着很大的区别,同时不同的是一个返回list,一个返回一个类型的iteratorMatchObject

假设我们有这样的数据:其中数字代表电话号,xx代表邮箱类型

标签:

提交需求或反馈

Demand feedback