Products
GG网络技术分享 2025-03-18 16:15 4
<li>要求:关注+点赞</li><li>链接:<a class=\"showurl\" href=\"taskView.aspxid=440230&rwid=621\">打开视频链接</a></li>
<li>创建:2020/10/29 12:55:19</li>
<li>审核: 进行中</li>
这是我抓的数据 怎么用正则匹配出:
href=\"taskView.aspxid=440230&rwid=621
其中,440230 和621 是不固定的 但数字的个数是固定的。
求教了大牛,搞了好久都没搞出来
用:href=\\\\\"[\\w\\.]+=\\d+&rwid=\\d+\\\\\"
如果想获取双引号中间的内容可以用href=\\\\\"([\\w.]+=\\d+&rwid=\\d+)\\\\\" ;取group(1)就行
做爬虫的话可以用xpath解析器,java应该是有三方包支持的
href=\\\"taskView.aspxid=([0-9]{6})&rwid=([0-9]{3})\\\"
正则有贪婪和非贪婪模式,所以你的最后集合只会有这两种的数据,不会出现如:zobo,boco。
代码片段:
Demand feedback