Products
GG网络技术分享 2025-03-18 16:14 18
使用正则解析以下字段 --->
适配器单元设置: SKT1:√ SKT2:√ SKT3:√ SKT4√
要求:解析出来的结果要求按照第一个\":\"进行分割,分成两组.本人使用了Groups分组截取,但是都是按照最后一个\":\"进行分割的,我写的正则如下:
正则表达式:\\d*:\\d*:\\d*:\\s*(?.*):\\s*(?.*)
匹配结果:为 第一部分:适配器单元设置: SKT1:√ SKT2:√ SKT3:√ SKT4
第二部分:√
但是我想得到的结果是这样的,第一部分:适配器单元设置第二部分:SKT1:√ SKT2:√ SKT3:√ SKT4√
应该怎么处理
https://blog.csdn.net/fay462298322/article/details/64449483/
在上一节中,我们已经可以用 requests 来获取网页的源代码,得到 HTML 代码。但我们真正想要的数据是包含在 HTML 代码之中的,怎么才能从 HTML 代码中获取我们想要的信息呢?正则表达式就是其中一个有效的方法。
本节中,我们了解一下正则表达式的相关用法。正则表达式是处理字符串的强大工具,它有自己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证都不在话下。
当然,对于爬虫来说,有了它,从 HTML 里提取想要的信息就非常方便了。
说了这么多,可能我们对它到底是个什么还是比较模糊,下面就用几个实例来看一下正则表达式的用法。
打开开源中国提供的正则表达式测试工具 http://tool.oschina.net/regex/,输入待匹配的文本,然后选择常用的正则表达式,就可以得出相应的匹配结果了。例如,这里输入待匹配的文本,具体如下:
Demand feedback