lzb1001 发表于 2022-4-24 21:53:49

关于正则表达式中的\d

本帖最后由 lzb1001 于 2022-4-24 22:25 编辑

\d:d表示digit数字,匹配Unicode中定义的数字字符(Unicode是Python3默认的字符串类型),与\D相反!

(1)对于 Unicode(str 类型)模式:匹配任何一个数字,包括 和其他数字字符;如果开启了 re.ASCII 标志,表示就只匹配ASCII码中定义的数字,也就是

(2)对于 8 位(bytes 类型)模式:在字符串前加上b,表示将字符串定义为bytes类型,那就匹配 中任何一个数字

第(2)不理解!!!可否举个例子???

人造人 发表于 2022-4-24 22:53:51

这个可以吗?

人造人 发表于 2022-4-24 23:04:38

>>> b = s.encode('utf-8')
Traceback (most recent call last):
File "<pyshell#22>", line 1, in <module>
    b = s.encode('utf-8')
UnicodeEncodeError: 'utf-8' codec can't encode characters in position 55296-57343: surrogates not allowed



页: [1]
查看完整版本: 关于正则表达式中的\d