关于正则表达式的使用问题
import ref = open('3.txt')
schools = []
a = []
for line in f:
if re.search(r'毕业学校',line):
school = re.findall(r'毕业学校[::\s]*[\u4e00-\u9fa5]{1,10}',line)
a.append(school)
schools.append(re.sub(r'[毕业学校::\s]','',school))
print(a)
print(schools)
f.close()
在文档3中,我按行输入了毕业学校:北京林业大学,毕业学校:中国矿业大学,毕业学校:蓝翔职业技术学院,毕业学校:清华大学
我想实现提取'毕业学校'之后的学校名,在列表a中,提取了包含毕业学校在内的信息,正常输出,但在将毕业学校替换的时候,后面的大学名字都少了一两个字,不知道是为啥,求大神解答! 你这所有“业”“学”字都被鲨了,可能是因为“毕业学校”里面也有这两个字(不是很懂) 墨羽岚 发表于 2020-3-18 17:37
你这所有“业”“学”字都被鲨了,可能是因为“毕业学校”里面也有这两个字(不是很懂)
哦哦哦,明白了,已运行成功,谢谢! 兄弟昵称有故事啊{:10_248:} 永恒的蓝色梦想 发表于 2020-3-18 20:44
兄弟昵称有故事啊
哎,悲惨的故事
页:
[1]