[已解决]pyhon中正则表达式的问题

python小小白哟 · 发表于 2023-6-13 16:16:09

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

以下是代码:

import re
content = 'Hello 1234567 World_This is a Regex Demo'
result = re.match('^Hello\s(\d+)\sWorld.*Demo$',content)
print(result)
print(result.group(1))
print(result.span())

复制代码

其中这段代码:

result = re.match('^Hello\s(\d+)\sWorld.*Demo$',content)

复制代码

中的 World是什么意思呢？匹配结尾不是以Demo结束的吗？

还有就是：

print(result.group(1))

复制代码

这段代码group(1) 传入的参数1表示的是什么呢？是否是分组呢？
如果是分组的话,输入0是否会显示出来 Hello 呢？然后输入1是从 Hello计算是0，然后1就是1234567呢？是否是这样理解的呢？
求大牛解答一下，谢谢。

最佳答案

月排行榜 / 总排行榜

isdkz

2023-6-13 16:20:46

在这段代码中，'World'只是一个要匹配的字符串的一部分，并不代表匹配的结束。正则表达式在这里匹配的是一个整体的字符串模式，而不只是某个特定的部分。'^Hello\s(\d+)\sWorld.*Demo$' 这个正则表达式的含义是：

· '^Hello' ：以 'Hello' 开头
· '\s'：匹配任何空白字符，包括空格、制表符、换页符等
· '(\d+)'：匹配一位或多位数字，并使用括号将其标记为一个分组
· '\sWorld'：后接一个空格和 'World'
· '.*'：匹配任意数量的任意字符
· 'Demo$'：以 'Demo' 结尾

所以在这个例子中，'World' 并没有特殊的含义，只是你的字符串中必须包含的一部分。

至于 'group(1)' 的部分，这里的参数1确实表示分组。在正则表达式中，括号 '()' 用于创建一个分组，当使用 'match' 或 'search' 函数时，你可以使用 'group' 方法来获取这些分组的内容。参数0对应于整个匹配的内容，参数1对应于第一个分组，参数2对应于第二个分组，以此类推。

因此，在你的例子中，'group(1)' 会返回字符串 '1234567'，这是因为它对应于你的正则表达式中的第一个（也是唯一的）分组。如果你调用 'group(0)'，它会返回整个匹配的字符串，即 'Hello 1234567 World_This is a Regex Demo'。

如果你想将 'Hello' 设为一个分组，你可以这样改写你的正则表达式：'^(\w+)\s(\d+)\sWorld.*Demo$'。在这个新的正则表达式中，'\w+' 匹配一个或多个字母或数字，因此 'Hello' 将被匹配并设为第一个分组，而 '1234567' 仍然是第二个分组。

跳转到最佳答案楼层

isdkz · 发表于 2023-6-13 16:20:46

在这段代码中，'World'只是一个要匹配的字符串的一部分，并不代表匹配的结束。正则表达式在这里匹配的是一个整体的字符串模式，而不只是某个特定的部分。'^Hello\s(\d+)\sWorld.*Demo$' 这个正则表达式的含义是：

· '^Hello' ：以 'Hello' 开头
· '\s'：匹配任何空白字符，包括空格、制表符、换页符等
· '(\d+)'：匹配一位或多位数字，并使用括号将其标记为一个分组
· '\sWorld'：后接一个空格和 'World'
· '.*'：匹配任意数量的任意字符
· 'Demo$'：以 'Demo' 结尾

所以在这个例子中，'World' 并没有特殊的含义，只是你的字符串中必须包含的一部分。

至于 'group(1)' 的部分，这里的参数1确实表示分组。在正则表达式中，括号 '()' 用于创建一个分组，当使用 'match' 或 'search' 函数时，你可以使用 'group' 方法来获取这些分组的内容。参数0对应于整个匹配的内容，参数1对应于第一个分组，参数2对应于第二个分组，以此类推。

因此，在你的例子中，'group(1)' 会返回字符串 '1234567'，这是因为它对应于你的正则表达式中的第一个（也是唯一的）分组。如果你调用 'group(0)'，它会返回整个匹配的字符串，即 'Hello 1234567 World_This is a Regex Demo'。

如果你想将 'Hello' 设为一个分组，你可以这样改写你的正则表达式：'^(\w+)\s(\d+)\sWorld.*Demo$'。在这个新的正则表达式中，'\w+' 匹配一个或多个字母或数字，因此 'Hello' 将被匹配并设为第一个分组，而 '1234567' 仍然是第二个分组。

账号		自动登录	找回密码
密码			立即注册