前女友我cnm 发表于 2020-3-18 17:28:24

关于正则表达式的使用问题

import re
f = open('3.txt')
schools = []
a = []
for line in f:   
    if re.search(r'毕业学校',line):               
      school = re.findall(r'毕业学校[::\s]*[\u4e00-\u9fa5]{1,10}',line)
      
      a.append(school)
      schools.append(re.sub(r'[毕业学校::\s]','',school))

print(a)
print(schools)


f.close()

在文档3中,我按行输入了毕业学校:北京林业大学,毕业学校:中国矿业大学,毕业学校:蓝翔职业技术学院,毕业学校:清华大学
我想实现提取'毕业学校'之后的学校名,在列表a中,提取了包含毕业学校在内的信息,正常输出,但在将毕业学校替换的时候,后面的大学名字都少了一两个字,不知道是为啥,求大神解答!

墨羽岚 发表于 2020-3-18 17:37:47

你这所有“业”“学”字都被鲨了,可能是因为“毕业学校”里面也有这两个字(不是很懂)

前女友我cnm 发表于 2020-3-18 17:42:36

墨羽岚 发表于 2020-3-18 17:37
你这所有“业”“学”字都被鲨了,可能是因为“毕业学校”里面也有这两个字(不是很懂)

哦哦哦,明白了,已运行成功,谢谢!

永恒的蓝色梦想 发表于 2020-3-18 20:44:51

兄弟昵称有故事啊{:10_248:}

前女友我cnm 发表于 2020-3-19 16:21:15

永恒的蓝色梦想 发表于 2020-3-18 20:44
兄弟昵称有故事啊

哎,悲惨的故事
页: [1]
查看完整版本: 关于正则表达式的使用问题