鱼C论坛

 找回密码
 立即注册
查看: 1273|回复: 2

[已解决]re.sub里的转义不对,怎么弄呢?

[复制链接]
发表于 2023-6-7 16:25:00 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
text_to_search1 = r'<script>darinspot.annotate();</script>'
replacement_text1 = r'<!--   <script>darinspot.annotate();</script>   -->'

f.write(re.sub(text_to_search1, replacement_text1, alllines, 1))

应该是 text_to_search1 里有 小数点,括号的原因。 但不管用r或者\来转义。 好像都不行。 到底是啥问题呢?
最佳答案
2023-6-7 16:26:26
在正则表达式中,小数点(".")和括号("()")都是特殊字符,具有特殊的含义。如果要在正则表达式中匹配这些字符本身,需要进行转义。在Python中,可以使用反斜杠("")来转义这些特殊字符。

但是你提供的代码中,text_to_search1 已经使用了原始字符串(r"...")的方式定义了,这意味着该字符串中所有的反斜杠都会被当做普通字符对待,不会起到转义的作用。因此,如果该字符串中包含了特殊字符,正则表达式会解析出错。

解决这个问题的方法是,将 text_to_search1 定义为普通字符串,并在其中使用双反斜杠("\")来转义特殊字符,例如:
  1. text_to_search1 = '<script>darinspot\\.annotate\\(\\);</script>'
  2. replacement_text1 = '<!--   <script>darinspot.annotate();</script>   -->'

  3. f.write(re.sub(text_to_search1, replacement_text1, alllines, 1))
复制代码

这样定义后,在进行正则表达式匹配时,就能正确匹配包含特殊字符的文本了。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-6-7 16:26:26 | 显示全部楼层    本楼为最佳答案   
在正则表达式中,小数点(".")和括号("()")都是特殊字符,具有特殊的含义。如果要在正则表达式中匹配这些字符本身,需要进行转义。在Python中,可以使用反斜杠("")来转义这些特殊字符。

但是你提供的代码中,text_to_search1 已经使用了原始字符串(r"...")的方式定义了,这意味着该字符串中所有的反斜杠都会被当做普通字符对待,不会起到转义的作用。因此,如果该字符串中包含了特殊字符,正则表达式会解析出错。

解决这个问题的方法是,将 text_to_search1 定义为普通字符串,并在其中使用双反斜杠("\")来转义特殊字符,例如:
  1. text_to_search1 = '<script>darinspot\\.annotate\\(\\);</script>'
  2. replacement_text1 = '<!--   <script>darinspot.annotate();</script>   -->'

  3. f.write(re.sub(text_to_search1, replacement_text1, alllines, 1))
复制代码

这样定义后,在进行正则表达式匹配时,就能正确匹配包含特殊字符的文本了。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-6-7 16:27:01 | 显示全部楼层
Python的  re  模块是一个用于处理正则表达式的模块, .  和  ()  在正则表达式中都有特殊的含义。 .  表示任何除了换行符的字符, ()  用于建立一个组。如果你想匹配字符串中的这些字符,你需要在它们前面加上反斜杠  \ 。

你提到你试过使用  r  前缀和  \  来转义这些字符,但似乎都不成功。  r  前缀的确可以用来避免 Python 解释字符串中的  \  为转义字符,但这并不能改变正则表达式自身对于这些字符的解析。 re.sub  第一个参数需要的是一个正则表达式,所以即使你在 Python 字符串层面上转义了这些字符,它们仍然会在正则表达式中被看作特殊字符。

因此,你需要在正则表达式中转义这些字符。可以像这样做:

  1. import re

  2. text_to_search1 = r'<script>darinspot\.annotate\(\);</script>'
  3. replacement_text1 = r'<!--   <script>darinspot.annotate();</script>   -->'

  4. f.write(re.sub(text_to_search1, replacement_text1, alllines, 1))
复制代码


这样, .  和  ()  都会被视为普通字符,而不是正则表达式中的特殊字符。

但是,你也应该注意到,这只在你确信  alllines  中的  <script>darinspot.annotate();</script>  都是准确的情况下才有效。如果存在一些微小的变化(比如空格、大小写、额外的字符等),这个表达式可能就不会匹配了。如果你需要处理这种情况,你可能需要使用更复杂的正则表达式,或者考虑使用其他的字符串处理方法。

评分

参与人数 1荣誉 +2 鱼币 +2 收起 理由
blackantt + 2 + 2 鱼C有你更精彩^_^

查看全部评分

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-20 19:42

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表