sym945 发表于 2021-10-29 15:17:57

不懂就问,有一段字符串,通过正则匹配到不需要的几段文字了,请问要怎么删除掉?

如题,请问大佬们,通过爬虫xpath爬取出了一大段文字了,有一部分是不需要的内容,我通过正则表达式,把有规律的不需要的那几段文字都正确选择好了,要怎么将选中的那部分给删除或替换成空,只留下我需要的内容输出呢?
例如下边的这段字符串,通过正则将“关于香蕉的产量xxxx”,“关于西瓜的销量xxx”给选中了,要怎么将选中的部分从这一大段字符串里给替换删除掉?

s = """
一二三
关于香蕉的产量xxxx
四五六
关于西瓜的销量xxx
七八九
"""

hrpzcf 发表于 2021-10-29 15:22:40

本帖最后由 hrpzcf 于 2021-10-29 15:30 编辑

替换后字符 = re.sub(表达式,替换为,原字符)

sym945 发表于 2021-10-29 15:32:57

hrpzcf 发表于 2021-10-29 15:22
替换后字符 = re.sub(表达式,替换为,原字符)

请问表达式,可以写正则么?

hrpzcf 发表于 2021-10-29 15:36:14

sym945 发表于 2021-10-29 15:32
请问表达式,可以写正则么?

表达式就是正则表达式,把你之前写的表达式放进去就行,替换为用空字符串

我不确定有没有记错参数顺序,你自己试试

sym945 发表于 2021-10-29 15:40:35

hrpzcf 发表于 2021-10-29 15:36
表达式就是正则表达式,把你之前写的表达式放进去就行,替换为用空字符串

我不确定有没有记错参数顺 ...

感谢大佬,已经试过了,替换成功
页: [1]
查看完整版本: 不懂就问,有一段字符串,通过正则匹配到不需要的几段文字了,请问要怎么删除掉?