其他教程

其他教程

Products

当前位置:首页 > 其他教程 >

正则表达式零宽断言一个细节求助,要疯了

GG网络技术分享 2025-03-18 16:15 6


问题描述:

((?<=\\d)\\d{3})+\\b,用它对1234567890进行查找时结果是234567890。
这是我学习的时候遇到的,这属于零宽度正回顾后发断言,结果的确是正确的,
然后我好奇的将重复次数3改成2,((?<=\\d)\\d{2})+\\b:结果为:34567890
图片说明

我的疑惑来了:
问题一:
我在想它的执行顺序,百度一堆乱七八糟的,有说从左到右,有说从右到左的,我真的被搞懵了,气的不行

图片说明

图片说明

上面这两个图片都是百度查的资料,说法又不一,要不是我自己测试上面那个将3改成2,我都没发现

问题二:
到底零宽断言表达式本身算不算在内,不算在内从左到右和从右到左匹配的到底有没有删,从右到左的话,比如:((?<=\\d)\\d{2})+\\b:结果为:34567890,这个不应该0不算在内而作为第一个匹配吗,快被虐哭了,求通俗的分析

网友观点:

从左向右匹配,当你写的是3的时候很幸运,直接匹配234 567 890
写2的话就很倒霉了,匹配23 45 67 89 因为你最后有一个\\b结果匹配失败,回退,跳到下一个数字匹配,34 56 78 90,匹配成功

是 + 号的问题, + 是量词,表示一个或多个,前面分组完后只剩下 23456789,由于 \\b 的原因,它会从后往前匹配,由于 + 号的原因,总字符数一定是能够把 \\d{n} 的 n 整除, 所以问题是在量词 + 号上

各位大佬,正则表达式求助,太折磨人了?

你要说一下你要从这两个div里面提取什么啊,目标要给一个啊。如果做爬虫的话,我建议用etree做网页解析提取,简单方便

标签:

提交需求或反馈

Demand feedback