正则中的反斜杠
正则中的反斜杠反斜杠 \ 在正则表达式中用处最为广泛。
如果反斜杠后面加上的是数字,那它还有两种用法:
[*]如果跟着的数字是 1~99,那么他表示引用序号对应的子组所匹配的字符串。
[*]如果跟着的数字是以 0 开头或者是三位数字,那么它是一个八进制数,表示的是这个八进制数对应的 ASCII 字符
被小括号括起来的正则表达式被称为一个子组。变成子组就可以把它们当做一个整体,例如在后面对它进行引用。
例如:
>>> import re
>>> re.search(r"(FishC)(aaa)\1", "FishC") # 这里的 \1 表示引用序号为 1 的子组,也就是 (FishC),所以整个正则表达式相当于 (FishC)(aaa)(FishC)
>>> # 这样是匹配不到的
>>> re.search(r"(FishC)(aaa)\1", "hahahaFishCaaaFishCFishC")
<re.Match object; span=(6, 19), match='FishCaaaFishC'>
如果反斜杠后面跟着的数字是以 0 开头或者三位的数字,那么会把这三位数字作为一个八进制数来看待。
例如:
>>> import re
>>> re.search(r"FishC\060", "FishCFishC0")
<re.Match object; span=(5, 11), match='FishC0'>
>>> print("\060")
0
>>> chr(int('060', 8)) # 和 "\060" 相同,所以上面的正则表达式相当于 FishC0
'0' 关于正则,我只知道
(.*?)
{:10_266:}
页:
[1]