A文件里的词汇 在B文件中的词频统计
本帖最后由 Amgalang 于 2020-11-10 11:04 编辑各位鱼友大家上午好,我的小问题希望您能给予支持,真心感谢......
我有A,B两个文件其内容如下:
A.txt
词汇,编码
二月,10923216N
方式,00111872N
方式,00266480N
方式,03856995N
B.txt
编码
10923216N
00111872N
00266480N
00266480N
03856995N
问题:
求A文件里的编码在B文件里的词频,生成的效果如下所示:
C.txt
词汇,编码,词频
二月,10923216N,1
方式,00111872N,1
方式,00266480N,2
方式,03856995N,1
再次感谢,因为等级原因我只能发几个鱼币,希望海涵。 本帖最后由 jackz007 于 2020-11-10 13:53 编辑
fa , fb = open('a.txt') , open('b.txt')
da , db = list(fa) , list(fb)
fa . close() ; fb . close()
dc = * len(da)
for ax in range(1 , len(da)):
for bx in range(1 , len(db)):
if db . strip() in da . strip() . split(','):
dc += 1
with open('c.txt' , 'wt') as fc:
fc . write('词汇,编码,词频\n')
for ax in range(1 , len(da)):
fc . write(da . strip() + ',' + str(dc) + '\n') import re
dict1={}
with open ("B.txt","r",encoding="utf8") as file1:
lines=file1.readlines()
for line in lines:
if re.search(r'\d+N',line.strip()):
if line.strip() in dict1:
dict1+=1
else:
dict1=1
with open ("C.txt","w",encoding="utf8") as file3:
file3.write("词汇,编码,词频\n")
with open ("A.txt","r",encoding="utf8") as file2:
lines=file2.readlines()
for line in lines:
info=line.strip().split(',')
if re.search(r'\d+N',info):
if info in dict1:
file3.write(line.strip()+","+str(dict1])+"\n")
print(line.strip()+",",dict1])
fall_bernana 发表于 2020-11-10 11:51
谢谢您的 回复 有点受宠若惊, 再次感谢 {:10_275:} jackz007 发表于 2020-11-10 12:11
哇,真心感谢您了,我学到了很多,我刚看见一行能打开两个文件 哈哈哈,再次感谢 fall_bernana 发表于 2020-11-10 11:51
再次感谢{:10_275:}
页:
[1]