鬼少 发表于 2024-12-1 23:21:55

正则表达式使用“\w+", 为何不能全部字符都找到?



import re

re.search(r'\w+','I want to go to swiming (我想去游泳!)')
            
<re.Match object; span=(0, 1), match='I'>

“\w+”是可以全部找到的, 为和只输出“I” ?

FishC 发表于 2024-12-1 23:27:07

在正则表达式中,`\w` 的含义是匹配字母、数字及下划线字符,相当于 ``,因此它无法匹配空格、标点符号或者中文字符。在 `re.search()` 满足匹配条件时,它只会返回第一个匹配的结果。

在你的例子中,输入字符串是 `I want to go to swiming (我想去游泳!)`,由于 `\w+` 匹配第一个字母或数字开始的连续字符,所以只匹配到了 `I`。

如果希望匹配整个文本的多个部分,可以尝试使用 `re.findall()`:

import re

result = re.findall(r'\w+', 'I want to go to swiming (我想去游泳!)')
print(result)

`re.findall()` 将返回所有匹配的部分,这样可以得到字符串中符合条件的所有部分。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
页: [1]
查看完整版本: 正则表达式使用“\w+", 为何不能全部字符都找到?