网站建设 >

查看其它板块

python中re模块简析-创新互联

re的分组功能

python的re模块有一个分组功能。所谓的分组就是去已经匹配到的内容里面再筛选出需要的内容，相当于二次过滤。

成都地区优秀IDC服务器托管提供商(成都创新互联公司).为客户提供专业的大邑服务器托管,四川各地服务器托管,大邑服务器托管、多线服务器托管.托管咨询专线：13518219792

实现分组靠圆括号（），而获得分组的内容靠的是group()，groups()，groupdict()方法。

re模块里的几个重要方法在分组上，有不同的表现形式，需要区别对待。

re实例

match()方法

不分组时的情况：

import re

origin = "hasdfi123123safd"
# 不分组时的情况
r = re.match("h\w+", origin)
print(r.group())         # 获取匹配到的整体结果
print(r.groups())        # 获取模型中匹配到的分组结果元组
print(r.groupdict())     # 获取模型中匹配到的分组中所有key的字典

结果：
hasdfi123123safd
()
{}

有分组的情况（注意圆括号！）

import re

origin = "hasdfi123123safd123"
# 有分组
r = re.match("h(\w+).*(?P\d)$", origin)
print(r.group())  # 获取匹配到的整体结果
print(r.group(1))  # 获取匹配到的分组1的结果
print(r.group(2))  # 获取匹配到的分组2的结果
print(r.groups())  # 获取模型中匹配到的分组结果元组
print(r.groupdict())  # 获取模型中匹配到的分组中所有key的字典

执行结果：
hasdfi123123safd123
asdfi123123safd12
3
('asdfi123123safd12', '3')
{'name': '3'}

说明⚠️：

（1）正则表达式h(\w+).*(?P<name>\d)$中有2个小括号，表示它分了2个小组，在匹配的时候是拿整体的表达式去匹配的，而不是拿小组去匹配的。
（2）(\w+)表示这个小组内是1到多个字母数字字符，相当于匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'。
（3）(?P<name>\d)中?P<name>是个正则表达式的特殊语法，表示给这个小组取了个叫“name”的名字，?P<xxxx>是固定写法。\d匹配一个数字字符。等价于[0-9]。
（4）在获取分组值的时候，group()和group(0)是对等的，都表示整个匹配到的字符串，从group(1)开始，分别是从左往右的小组序号，按位置顺序来。

search()方法

有分组的情况：

import re

origin = "sdfi1ha23123safd123"      # 注意这里对匹配对象做了下调整
# 有分组
r = re.search("h(\w+).*(?P\d)$", origin)
print(r.group())  
print(r.group(0))  
print(r.group(1))  
print(r.group(2))
print(r.groups())  
print(r.groupdict()) 

执行结果：
ha23123safd123
ha23123safd123
a23123safd12
3
('a23123safd12', '3')
{'name': '3'}

说明⚠️：表现得和match()方法基本一样。

match()方法与search()方法区别

re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None；而re.search匹配整个字符串，直到找到一个匹配。

举例如下：

#!/usr/bin/python
import re

line = "Cats are smarter than dogs";

matchObj = re.match( r'dogs', line, re.M|re.I)
if matchObj:
   print "match --> matchObj.group() : ", matchObj.group()
else:
   print "No match!!"

matchObj = re.search( r'dogs', line, re.M|re.I)
if matchObj:
   print "search --> matchObj.group() : ", matchObj.group()
else:
   print "No match!!"

以上代码执行结果如下：

No match!!
search --> matchObj.group() :  dogs

扩展

正则表达式实例：

#!/usr/bin/python
import re
line = "Cats are smarter than dogs"
matchObj = re.match( r'(.*) are (.*?) .*', line, re.M|re.I)
if matchObj:
    print "matchObj.group() : ", matchObj.group()
    print "matchObj.group(1) : ", matchObj.group(1)
    print "matchObj.group(2) : ", matchObj.group(2)
else:
    print "No match!!"

说明⚠️：关于正则表达式r'(.*) are (.*?) .*'

（1）首先，这是一个字符串，前面的一个 r 表示字符串为非转义的原始字符串，让编译器忽略反斜杠，也就是忽略转义字符。但是这个字符串里没有反斜杠，所以这个 r 可有可无。
（2）(.) 第一个匹配分组，. 代表匹配除换行符之外的所有字符。
（3）(.?) 第二个匹配分组，.? 后面多个问号，代表非贪婪模式，也就是说只匹配符合条件的最少字符。
（4）后面的一个 .* 没有括号包围，所以不是分组，匹配效果和第一个一样，但是不计入匹配结果中。
（5）matchObj.group() 等同于 matchObj.group(0)，表示匹配到的完整文本字符
matchObj.group(1) 得到第一组匹配结果，也就是(.*)匹配到的
matchObj.group(2) 得到第二组匹配结果，也就是(.*?)匹配到的
因为只有匹配结果中只有两组，所以如果填 3 时会报错。

参考文档

刘江python教程
python正则表达式01-re
python正则表达式02-re

另外有需要云服务器可以了解下创新互联cdcxhl.cn，海内外云服务器15元起步，三天无理由+7*72小时售后在线，公司持有idc许可证，提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案，具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势，专为企业上云打造定制，能够满足用户丰富、多元化的应用场景需求。

新闻名称：python中re模块简析-创新互联
链接分享：http://www.cdkjz.cn/article/gigcc.html

返回首页了解更多建站资讯

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

电信机房托管服务器全网整合营销推广古巴雪茄威斯达宇衣柜书柜酒柜定制成都网页制作免备案虚拟主机空间微信小程序开发圣月冷冻库成都网站建设

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

python中re模块简析-创新互联

re的分组功能

re实例

match()方法

不分组时的情况：

有分组的情况（注意圆括号！）

search()方法

有分组的情况：

match()方法与search()方法区别

扩展

参考文档

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

python中re模块简析-创新互联

re的分组功能

re实例

match()方法

不分组时的情况：

有分组的情况（注意圆括号！）

search()方法

有分组的情况：

match()方法与search()方法区别

扩展

参考文档

相关资讯

富士康SAP系统英语的简单介绍

Vb点虐 定义命名空间 vba命名

go语言视频文件分析 go ffmpeg解析视频文件

ciscoserver域名怎么配置 cisco服务器域名访问

关于sap系统怎么看生产计划的信息

怎么给抖音起领域名 怎么给抖音起领域名的名字

包含sap系统登录配置的词条

禁止cmd对服务器安全 禁止服务器文件复制

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

Vb点虐定义命名空间 vba命名

怎么给抖音起领域名怎么给抖音起领域名的名字

禁止cmd对服务器安全禁止服务器文件复制

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接