GG资源网

请问如何用正则表达式选出一大段文字中的特定内容?

问题描述:

小弟最近在写一个爬取电商网站的用户评论的作业,发现天猫的用户评论都在一个特定的网页下,但是这个网页的body就是一大段文字,直接用element.text()输出的话也输出不了中文(好像是UTF-8的格式。。。),请问怎么把网页中的所有评论输出?请问如何用正则表达式选出一大段文字中的特定内容?请问如何用正则表达式选出一大段文字中的特定内容?就是输出图片中的中文,每个评论一行,请问怎么做?
谢谢各位大神了!

网友观点:

这不是json吗?为什么会想到用正则,方向都错了。在java里如果正则写得有问题会卡死,我感觉是个非常不得已而为之的方法。

正则得话就是

逗号双引号冒号都不是关键字,唯一要注意的就是.*后的问号表示非贪婪,否则会出问题

如何用正则表达式提取指定位数内容?

谢邀,字符串的话,可以直接用subString方法提取出5到9和10到14位,不同的语言有各自的处理方法。网址的匹配表达式:"[a-zA-Z]{2,5}://\\\\w*\\\\.\\\\w*\\\\.[a-z]{2,3}",这个是针对题主给出的字符串对应的很简单的正则,如果要匹配更复杂的或其他比如email地址等,可以百度到很多更严格和漂亮的表达式。

由于网站搬家,部分链接失效,如无法下载,请联系站长!谢谢支持!
1. 带 [亲测] 说明源码已经被站长亲测过!
2. 下载后的源码请在24小时内删除,仅供学习用途!
3. 分享目的仅供大家学习和交流,请不要用于商业用途!
4. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
5. 本站所有资源来源于站长上传和网络,如有侵权请邮件联系站长!
6. 没带 [亲测] 代表站长时间紧促,站长会保持每天更新 [亲测] 源码 !
7. 盗版ripro用户购买ripro美化无担保,若设置不成功/不生效我们不支持退款!
8. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
9. 如果你也有好源码或者教程,可以到审核区发布,分享有金币奖励和额外收入!
10.如果您购买了某个产品,而我们还没来得及更新,请联系站长或留言催更,谢谢理解 !
GG资源网 » 请问如何用正则表达式选出一大段文字中的特定内容?

发表回复

CAPTCHAis initialing...