当前位置：首页 > 其他教程 >

正则表达式抽取文本。

GG网络技术分享 2025-03-18 16:14 65

问题描述：

如题，请如何使用正则表达式抽取想要id= 到&这个之间的文本数据？
抽紫，抽子，愁字，凑字。

网友观点：

import re
a="...id=1234&"s=re.search(r'id=(.*)&',a)
printf(s.group(1)) #1234

a = re.compile('id=([^&]+)&')
a.findall(url)

正则表达式提取公式RegexString()

公式名称：RegexString(Text,Rule,Advance,Index)

用途说明：在Excel表格或WPS表格中，使用正在表达式公式RegexString(Text,Rule,Advance,Inde)从一段文本中提取需要的字符（数据）。

参数说明：参数Text指原始文本；Rule指正则表达式匹配规则，这里使用的是C#.NET支持的正则表达式规则；Advance指是否是高级模式，0表示默认，1表示使用高级模式，即直接输入正则表达式；Index指当匹配结果多个时按顺序返回给定序号（索引）的值，默认为0，表示返回全部，填N表示返回结果中第N个值，如果N大于结果中的数量，则返回最后一个值。

数据来源：本地

运行环境：Excel2007及以上，WPS2019及以上

如下图所示，书写公式=RegexString($H$2,"value=\\""([A-Z]+)\\"">([\\u4e00-\\u9fa5]{1,})",1,G3)从单元格H2中查找币种代码。单元格H2的内容是一段网页源代码，规律是“value="币种代码">币种名称”。

如下图所示，书写公式=RegexString($H$2,"value=\\""[A-Z]+\\"">([\\u4e00-\\u9fa5]{1,})",1,G3)从单元格H2中查找币种名称。单元格H2的内容是一段网页源代码，规律是“value="币种代码">币种名称”。

要点说明

正则表达式([A-Z]+)表示匹配一个以上的大写字母，这里用来匹配币种代码，其中括号()表示要返回的结果，括号外的数据不返回；
正则表达式[\\u4e00-\\u9fa5]{1,}表示匹配一个以上的汉字，这里用来匹配币种名称;
在公式中，双引号有特殊用途，如果要输入一个普通的双引号，可以输入两个双引号，此时表示一个双引号;
$H$2，表示绝对引用，这样往下拖动公式时，引用的还是单元格H2；
图中G列是辅助列，用来递增序号，以便获得要返回值的索引。

标签：

上一篇：正则表达式抽取ip地址
下一篇： python正则表达式—匹配图片地址

其他教程

正则表达式抽取文本。

问题描述：

网友观点：

正则表达式提取公式RegexString()

为您推荐

提交需求或反馈

产品中心

H5单页免费源码

免费源码

联系我们

QQ在线客服

关注微信