其他教程

其他教程

Products

当前位置:首页 > 其他教程 >

利用正则表达式从重复出现的符号的第一个开始截取字段

GG网络技术分享 2025-03-18 16:14 18


问题描述:

使用正则解析以下字段 --->

适配器单元设置: SKT1:√ SKT2:√ SKT3:√ SKT4√

要求:解析出来的结果要求按照第一个\":\"进行分割,分成两组.本人使用了Groups分组截取,但是都是按照最后一个\":\"进行分割的,我写的正则如下:
正则表达式:\\d*:\\d*:\\d*:\\s*(?.*):\\s*(?.*)
匹配结果:为 第一部分:适配器单元设置: SKT1:√ SKT2:√ SKT3:√ SKT4
第二部分:√

但是我想得到的结果是这样的,第一部分:适配器单元设置

第二部分:SKT1:√ SKT2:√ SKT3:√ SKT4√

应该怎么处理

网友观点:

https://blog.csdn.net/fay462298322/article/details/64449483/

【2022 年】崔庆才 Python3 爬虫教程 - 强大灵活的正则表达式

在上一节中,我们已经可以用 requests 来获取网页的源代码,得到 HTML 代码。但我们真正想要的数据是包含在 HTML 代码之中的,怎么才能从 HTML 代码中获取我们想要的信息呢?正则表达式就是其中一个有效的方法。

本节中,我们了解一下正则表达式的相关用法。正则表达式是处理字符串的强大工具,它有自己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证都不在话下。

当然,对于爬虫来说,有了它,从 HTML 里提取想要的信息就非常方便了。

1. 实例引入

说了这么多,可能我们对它到底是个什么还是比较模糊,下面就用几个实例来看一下正则表达式的用法。

打开开源中国提供的正则表达式测试工具 http://tool.oschina.net/regex/,输入待匹配的文本,然后选择常用的正则表达式,就可以得出相应的匹配结果了。例如,这里输入待匹配的文本,具体如下:

标签:

提交需求或反馈

Demand feedback