sym945 发表于 2021-10-27 16:59:34

正则表达式匹配以“关于”开头的字符串,要怎么写?

请问大佬们,python中一大串字符中,要写一个取出来几个以“关于”两个中文字开头的一句话,这个正则要怎么写?比如有一句话是“关于xxx的来龙去脉”这样的一段话,我写了,re.compile(u'^关[\u4e00-\u9fa5]+$'),不管用

suchocolate 发表于 2021-10-27 17:32:27

import re

s = """
一二三
关于香蕉的产量xxxx
四五六
关于西瓜的销量xxx
七八九
结束
"""

result = re.findall(r'^关于.*', s, re.M)
print(result)

sym945 发表于 2021-10-27 17:41:21

suchocolate 发表于 2021-10-27 17:32


感谢大佬的正则,精确的匹配到了,想追加问下,其实要匹配的字符串还有(代转)这样的开头的字符串,要跟这个“关于”开头的一起匹配到这几句话,要怎么写呢?

sym945 发表于 2021-10-27 17:44:13

suchocolate 发表于 2021-10-27 17:32


感谢大佬,我用您的正则,加上或符号,把我想要的东西都匹配到了,感谢

suchocolate 发表于 2021-10-27 17:45:31

本帖最后由 suchocolate 于 2021-10-27 17:46 编辑

sym945 发表于 2021-10-27 17:41
感谢大佬的正则,精确的匹配到了,想追加问下,其实要匹配的字符串还有(代转)这样的开头的字符串,要跟 ...

import re

s = """
一二三
关于香蕉的产量xxxx
四五六
关于西瓜的销量xxx
七八九

一二三
代转菠萝的运输xxx
四五六
代转橘子的上涨xxx
七八九

"""

result = re.findall(r'^代转.*|^关于.*', s, re.M)
# 或者 result = re.findall(r'(?:^代转|^关于).*', s, re.M)
print(result)

sym945 发表于 2021-10-27 17:49:26

suchocolate 发表于 2021-10-27 17:45


大佬,我想实现的效果是,正则匹配到这几段话之后,从字符串中将这些字符串都删除,要怎么写?

suchocolate 发表于 2021-10-27 17:57:43

sym945 发表于 2021-10-27 17:49
大佬,我想实现的效果是,正则匹配到这几段话之后,从字符串中将这些字符串都删除,要怎么写?

还有什么需求一次性说完吧。
import re

s = """
一二三
关于香蕉的产量xxxx
四五六
关于西瓜的销量xxx
七八九

一二三
代转菠萝的运输xxx
四五六
代转橘子的上涨xxx
七八九

"""

result = re.sub(r'代转.*|关于.*', '', s)
print(result)
页: [1]
查看完整版本: 正则表达式匹配以“关于”开头的字符串,要怎么写?