zltzlt 发表于 2020-1-30 21:04:59

正则中的反斜杠

正则中的反斜杠

反斜杠 \ 在正则表达式中用处最为广泛。

如果反斜杠后面加上的是数字,那它还有两种用法:


[*]如果跟着的数字是 1~99,那么他表示引用序号对应的子组所匹配的字符串。
[*]如果跟着的数字是以 0 开头或者是三位数字,那么它是一个八进制数,表示的是这个八进制数对应的 ASCII 字符


被小括号括起来的正则表达式被称为一个子组。变成子组就可以把它们当做一个整体,例如在后面对它进行引用。

例如:

>>> import re
>>> re.search(r"(FishC)(aaa)\1", "FishC")    # 这里的 \1 表示引用序号为 1 的子组,也就是 (FishC),所以整个正则表达式相当于 (FishC)(aaa)(FishC)
>>> # 这样是匹配不到的
>>> re.search(r"(FishC)(aaa)\1", "hahahaFishCaaaFishCFishC")
<re.Match object; span=(6, 19), match='FishCaaaFishC'>

如果反斜杠后面跟着的数字是以 0 开头或者三位的数字,那么会把这三位数字作为一个八进制数来看待。

例如:

>>> import re
>>> re.search(r"FishC\060", "FishCFishC0")
<re.Match object; span=(5, 11), match='FishC0'>
>>> print("\060")
0
>>> chr(int('060', 8))    # 和 "\060" 相同,所以上面的正则表达式相当于 FishC0
'0'

xiaosi4081 发表于 2020-6-15 07:42:24

关于正则,我只知道
(.*?)
{:10_266:}
页: [1]
查看完整版本: 正则中的反斜杠