在Java程序中如何匹配正则表达式所匹配的结果?
问题描述:
例如我写了一个正则,可以匹配百度上面所有的a标签
1 2 3 4 5 6 7 8 9 10 11 |
public static void main(String[] args) { String baiduHtml = getUrlString(); System.out.println(baiduHtml); Pattern pattern = Pattern.compile(\"<a(.*?)>(.*?)</a>\"); Matcher matcher = pattern.matcher(baiduHtml); if (matcher.find()) { System.out.println(matcher.group()); } } |
输出结果
1 2 |
<a href=http://news.baidu.com name=tj_trnews class=mnav>新闻</a> |
网友观点:
对于这类xml格式,最好不用正则匹配,处理会很麻烦
可以用xml类库来解析
http://www.ibm.com/developerworks/cn/xml/dm-1208gub/
一般处理xml不会用正则,而是xpath
可以用matcher,参考
http://blog.csdn.net/debugingstudy/article/details/12720087
正则表达式分组命名捕获 (?(.*?))
http://blog.csdn.net/su1216/article/details/49407381
正则表达式分组命名捕获
http://blog.csdn.net/su1216/article/details/49407381
String s = \\\"2015-10-26\\\";
Pattern p = Pattern.compile(\\\"(?\\d{4})-(?\\d{2})-(?\\d{2})\\\");
Matcher m = p.matcher(s);
if (m.find()) {
System.out.println(\\\"year: \\\" + m.group(\\\"year\\\")); //年
System.out.println(\\\"month: \\\" + m.group(\\\"month\\\")); //月
System.out.println(\\\"day: \\\" + m.group(\\\"day\\\")); //日
1 2 3 4 |
System.out.println(\\\"year: \\\" + m.group(1)); //第一组 System.out.println(\\\"month: \\\" + m.group(2)); //第二组 System.out.println(\\\"day: \\\" + m.group(3)); //第三组 |
}
Java正则表达式详细解析
元字符
- 正则表达式使用一些特定的元字符来检索、匹配和替换符合规则的字符串
- 元字符:普通字符、标准字符、限定字符(量词)、定位字符(边界字符)
正则表达式引擎
- 正则表达式是一个用正则符号写出来的公式
- 程序对正则表达式进行语法分析,建立语法分析树
- 再根据语法分析树结合正则表达式引擎生成执行程序(状态机),用于字符匹配
- 正则表达式引擎是一套核心算法,用于建立状态机
- 小结
- 正则表达式 => 语法分析树
- 语法分析树 + 正则表达引擎 => 状态机 => 用于字符匹配
- 目前实现正则表达式引擎的方式有两种
- DFA自动机(Deterministic Finite Automaton,确定有限状态自动机)
- NFA自动机(Nondeterministic Finite Automaton,非确定有限状态自动机)
- DFA自动机的构造代价远大于NFA自动机,但DFA自动机的执行效率高于NFA自动机
- 假设一个字符串的长度为n,如果采用DFA自动机作为正则表达式引擎,则匹配的时间复杂度为O(n)
- 如果采用NFA自动机作为正则表达式引擎,NFA自动机在匹配过程中存在大量的分支和回溯,假设NFA的状态数为s,
- 则匹配的时间复杂度为O(ns)
- NFA自动机的优势是支持更多高级功能,但都是基于子表达式独立进行匹配
- 因此在编程语言里,使用的正则表达式库都是基于NFA自动机实现的
NFA自动机
匹配过程
- NFA自动机会读取正则表达式的每一个字符,拿去和目标字符串匹配
- 匹配成功则换正则表达式的下一个字符,反之就继续就和目标字符串的下一个字符进行匹配
由于网站搬家,部分链接失效,如无法下载,请联系站长!谢谢支持!
1. 带 [亲测] 说明源码已经被站长亲测过!
2. 下载后的源码请在24小时内删除,仅供学习用途!
3. 分享目的仅供大家学习和交流,请不要用于商业用途!
4. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
5. 本站所有资源来源于站长上传和网络,如有侵权请邮件联系站长!
6. 没带 [亲测] 代表站长时间紧促,站长会保持每天更新 [亲测] 源码 !
7. 盗版ripro用户购买ripro美化无担保,若设置不成功/不生效我们不支持退款!
8. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
9. 如果你也有好源码或者教程,可以到审核区发布,分享有金币奖励和额外收入!
10.如果您购买了某个产品,而我们还没来得及更新,请联系站长或留言催更,谢谢理解 !
GG资源网 » 在Java程序中如何匹配正则表达式所匹配的结果?
1. 带 [亲测] 说明源码已经被站长亲测过!
2. 下载后的源码请在24小时内删除,仅供学习用途!
3. 分享目的仅供大家学习和交流,请不要用于商业用途!
4. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
5. 本站所有资源来源于站长上传和网络,如有侵权请邮件联系站长!
6. 没带 [亲测] 代表站长时间紧促,站长会保持每天更新 [亲测] 源码 !
7. 盗版ripro用户购买ripro美化无担保,若设置不成功/不生效我们不支持退款!
8. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
9. 如果你也有好源码或者教程,可以到审核区发布,分享有金币奖励和额外收入!
10.如果您购买了某个产品,而我们还没来得及更新,请联系站长或留言催更,谢谢理解 !
GG资源网 » 在Java程序中如何匹配正则表达式所匹配的结果?