鱼C论坛

 找回密码
 立即注册
查看: 1875|回复: 1

[已解决]pyhon中正则表达式的问题

[复制链接]
发表于 2023-6-13 16:16:09 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
以下是代码:
import re

content = 'Hello 1234567 World_This is a Regex Demo'
result = re.match('^Hello\s(\d+)\sWorld.*Demo$',content)
print(result)
print(result.group(1))
print(result.span())


其中这段代码:
result = re.match('^Hello\s(\d+)\sWorld.*Demo$',content)

中的 World是什么意思呢?匹配结尾不是以Demo结束的吗?

还有就是:
print(result.group(1))
这段代码group(1) 传入的参数1表示的是什么呢?是否是分组呢?
如果是分组的话,输入0是否会显示出来 Hello 呢?  然后输入1是从 Hello计算是0, 然后1就是1234567呢? 是否是这样理解的呢?
求大牛解答一下,谢谢。
最佳答案
2023-6-13 16:20:46
在这段代码中,'World'只是一个要匹配的字符串的一部分,并不代表匹配的结束。正则表达式在这里匹配的是一个整体的字符串模式,而不只是某个特定的部分。'^Hello\s(\d+)\sWorld.*Demo$' 这个正则表达式的含义是:

· '^Hello' :以 'Hello' 开头
· '\s':匹配任何空白字符,包括空格、制表符、换页符等
· '(\d+)':匹配一位或多位数字,并使用括号将其标记为一个分组
· '\sWorld':后接一个空格和 'World'
· '.*':匹配任意数量的任意字符
· 'Demo$':以 'Demo' 结尾

所以在这个例子中,'World' 并没有特殊的含义,只是你的字符串中必须包含的一部分。

至于 'group(1)' 的部分,这里的参数1确实表示分组。在正则表达式中,括号 '()' 用于创建一个分组,当使用 'match' 或 'search' 函数时,你可以使用 'group' 方法来获取这些分组的内容。参数0对应于整个匹配的内容,参数1对应于第一个分组,参数2对应于第二个分组,以此类推。

因此,在你的例子中,'group(1)' 会返回字符串 '1234567',这是因为它对应于你的正则表达式中的第一个(也是唯一的)分组。如果你调用 'group(0)',它会返回整个匹配的字符串,即 'Hello 1234567 World_This is a Regex Demo'。

如果你想将 'Hello' 设为一个分组,你可以这样改写你的正则表达式:'^(\w+)\s(\d+)\sWorld.*Demo$'。在这个新的正则表达式中,'\w+' 匹配一个或多个字母或数字,因此 'Hello' 将被匹配并设为第一个分组,而 '1234567' 仍然是第二个分组。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-6-13 16:20:46 | 显示全部楼层    本楼为最佳答案   
在这段代码中,'World'只是一个要匹配的字符串的一部分,并不代表匹配的结束。正则表达式在这里匹配的是一个整体的字符串模式,而不只是某个特定的部分。'^Hello\s(\d+)\sWorld.*Demo$' 这个正则表达式的含义是:

· '^Hello' :以 'Hello' 开头
· '\s':匹配任何空白字符,包括空格、制表符、换页符等
· '(\d+)':匹配一位或多位数字,并使用括号将其标记为一个分组
· '\sWorld':后接一个空格和 'World'
· '.*':匹配任意数量的任意字符
· 'Demo$':以 'Demo' 结尾

所以在这个例子中,'World' 并没有特殊的含义,只是你的字符串中必须包含的一部分。

至于 'group(1)' 的部分,这里的参数1确实表示分组。在正则表达式中,括号 '()' 用于创建一个分组,当使用 'match' 或 'search' 函数时,你可以使用 'group' 方法来获取这些分组的内容。参数0对应于整个匹配的内容,参数1对应于第一个分组,参数2对应于第二个分组,以此类推。

因此,在你的例子中,'group(1)' 会返回字符串 '1234567',这是因为它对应于你的正则表达式中的第一个(也是唯一的)分组。如果你调用 'group(0)',它会返回整个匹配的字符串,即 'Hello 1234567 World_This is a Regex Demo'。

如果你想将 'Hello' 设为一个分组,你可以这样改写你的正则表达式:'^(\w+)\s(\d+)\sWorld.*Demo$'。在这个新的正则表达式中,'\w+' 匹配一个或多个字母或数字,因此 'Hello' 将被匹配并设为第一个分组,而 '1234567' 仍然是第二个分组。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-27 12:06

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表