|
楼主 |
发表于 2022-4-28 11:45:12
|
显示全部楼层
本帖最后由 lzb1001 于 2022-4-28 11:47 编辑
测试了,以下好像结果(见下面四个红色字体的返回结果)都一样呢,所以更有点糊涂啊……
>>> charref = re.compile(r''' # 开启VERBOSE,并使用原始字符串(r+字符串)
&[#] # 开始数字引用
(
0[0-7]+ # 八进制格式
|[0-9]+ # 十进制格式
|x[0-9a-fA-F]+ # 十六进制格式
)
; # 结尾分号
''',re.X)
>>> charref.match('
')
<re.Match object; span=(0, 6), match='
'>
--------------------------------
>>> charref = re.compile('&[#](0[0-7]+|[0-9]+|x[0-9a-fA-F]+);') # 不开启VERBOSE,也不使用原始字符串(r+字符串)
>>> charref.search('
')
<re.Match object; span=(0, 6), match='
'>
-----------------------------------
>>> charref = re.compile(''' # 开启VERBOSE,但不使用原始字符串(r+字符串)
&[#] # 开始数字引用
(
0[0-7]+ # 八进制格式
|[0-9]+ # 十进制格式
|x[0-9a-fA-F]+ # 十六进制格式
)
; # 结尾分号
''',re.X)
>>> charref.match('
')
<re.Match object; span=(0, 6), match='
'>
-------------------------------------------
>>> charref = re.compile(r'&[#](0[0-7]+|[0-9]+|x[0-9a-fA-F]+);') # 不开启VERBOSE,但使用原始字符串(r+字符串)
>>> charref.search('
')
<re.Match object; span=(0, 6), match='
'> |
|