写错表达式,得出的结果看不懂
>>> result = re.findall(r'(\w+)(\w+)', 'I love FishC.com!')>>> result
[('lov', 'e'), ('Fish', 'C'), ('co', 'm')]
>>> result = re.findall(r'(\w+)(\w+)', 'I love FishC_com!')
>>> result
[('lov', 'e'), ('FishC_co', 'm')]
为什么会得到上面的结果? 本帖最后由 suchocolate 于 2022-4-30 21:44 编辑
有无()组
1)re.findall默认把pattern当作一个大的()组,如其中没有空号,显示的结果就是字符串组成的列表:
import re
pattern = "\d" # 外层隐含着()
s = "ddd.111kkkk6666lll"
result = re.findall(pattern, s)
print(result)
pattern2 = "(\d)" # 直接加一个()看看结果
result = re.findall(pattern2, s)
print(result)
输出结果都是:
['1k', '6l']
['1k', '6l']
2)如果pattern里有括号(),那么根据()括号的数目,以元组组成的列表显示:
import re
pattern = "(\d)()"
s = "ddd.111kkkk6666lll"
result = re.findall(pattern, s)
print(result)
输出结果:
[('1', 'k'), ('6', 'l')]
本帖最后由 lzb1001 于 2022-4-30 16:53 编辑
suchocolate 发表于 2022-4-30 00:09
有无()组
1)re.findall默认把pattern当作一个大的()组,如其中没有空号,显示的结果就是字符串组成的列表 ...
感谢大神的解疑释惑
既然可以用()分组:
>>> result = re.findall(r'(\w+)(\w+)', 'I love FishC.com!')
>>> result
[('lov', 'e'), ('Fish', 'C'), ('co', 'm')]
但下面得到的result却没有()分组:
>>> result = re.findall(r'\w+|\s|\.|!', 'I love FishC_com!')
>>> result
['I', ' ', 'love', ' ', 'FishC_com', '!']
但如果我想得出的结果格式如下所示,应如何书写代码……呢?
>>> ……
>>> result
[('I'), (''), ('love'), (''), ('FishC_com'), ('!')]
我试着这样写,但得到的结果只有一个():
>>> result = re.findall(r'(\w+)(\s)(\w+)(\s)(\w+)(!)', 'I love FishC_com!')
>>> result
[('I', ' ', 'love', ' ', 'FishC_com', '!')] 有点异想天开了吧
[('1', 'k'), ('6', 'l')]
红色:匹配第一次,一次两个元素,也就是说,结果的括号表示匹配一次,括号里的元素个数是pattern里写的小括号的个数。
蓝色:匹配第二次,同上。
按照你的预想结果:[('I'), (''), ('love'), (''), ('FishC_com'), ('!')]
就得匹配6次,但是每次匹配,元素只有一个,那么说明你的patter里就只有一小括号,或者没有,这样re就会自动去掉括号,变成
['I', ' ', 'love', ' ', 'FishC_com', '!'],所以你的预想不会实现。
另外,得出['I', ' ', 'love', ' ', 'FishC_com', '!']的简单写法:
result = re.findall(r'\w+|\W', 'I love FishC_com!')
print(result)
页:
[1]