Amgalang 发表于 2020-11-10 11:03:50

A文件里的词汇 在B文件中的词频统计

本帖最后由 Amgalang 于 2020-11-10 11:04 编辑

各位鱼友大家上午好,我的小问题希望您能给予支持,真心感谢......

我有A,B两个文件其内容如下:
        A.txt
                词汇,编码
                二月,10923216N
                方式,00111872N
                方式,00266480N
                方式,03856995N
        B.txt
                编码
                10923216N
                00111872N
                00266480N
                00266480N
                03856995N
问题:
求A文件里的编码在B文件里的词频,生成的效果如下所示:
        C.txt
                词汇,编码,词频
                二月,10923216N,1
                方式,00111872N,1
                方式,00266480N,2
                方式,03856995N,1
再次感谢,因为等级原因我只能发几个鱼币,希望海涵。

jackz007 发表于 2020-11-10 11:03:51

本帖最后由 jackz007 于 2020-11-10 13:53 编辑

fa , fb = open('a.txt') , open('b.txt')
da , db = list(fa) , list(fb)
fa . close() ; fb . close()
dc = * len(da)
for ax in range(1 , len(da)):
    for bx in range(1 , len(db)):
      if db . strip() in da . strip() . split(','):
            dc += 1
with open('c.txt' , 'wt') as fc:
    fc . write('词汇,编码,词频\n')
    for ax in range(1 , len(da)):
      fc . write(da . strip() + ',' + str(dc) + '\n')

fall_bernana 发表于 2020-11-10 11:51:28

import re
dict1={}
with open ("B.txt","r",encoding="utf8") as file1:
    lines=file1.readlines()
    for line in lines:
      if re.search(r'\d+N',line.strip()):
            if line.strip() in dict1:
                dict1+=1
            else:
                dict1=1
with open ("C.txt","w",encoding="utf8") as file3:
    file3.write("词汇,编码,词频\n")
    with open ("A.txt","r",encoding="utf8") as file2:
      lines=file2.readlines()
      for line in lines:
            info=line.strip().split(',')
            if re.search(r'\d+N',info):
                if info in dict1:
                  file3.write(line.strip()+","+str(dict1])+"\n")
                  print(line.strip()+",",dict1])

Amgalang 发表于 2020-11-10 13:51:03

fall_bernana 发表于 2020-11-10 11:51


谢谢您的 回复 有点受宠若惊, 再次感谢 {:10_275:}

Amgalang 发表于 2020-11-10 13:52:10

jackz007 发表于 2020-11-10 12:11


哇,真心感谢您了,我学到了很多,我刚看见一行能打开两个文件 哈哈哈,再次感谢

Amgalang 发表于 2020-11-10 13:54:13

fall_bernana 发表于 2020-11-10 11:51


再次感谢{:10_275:}
页: [1]
查看完整版本: A文件里的词汇 在B文件中的词频统计