A文件里的词汇在B文件中的词频统计,Python交流,编程语言专区,鱼C论坛

Amgalang 发表于 2020-11-10 11:03:50

A文件里的词汇在B文件中的词频统计

本帖最后由 Amgalang 于 2020-11-10 11:04 编辑

各位鱼友大家上午好，我的小问题希望您能给予支持，真心感谢......

我有A,B两个文件其内容如下：
A.txt
词汇,编码
二月,10923216N
方式,00111872N
方式,00266480N
方式,03856995N
B.txt
编码
10923216N
00111872N
00266480N
00266480N
03856995N
问题：
求A文件里的编码在B文件里的词频，生成的效果如下所示：
C.txt
词汇，编码，词频
二月,10923216N，1
方式,00111872N，1
方式,00266480N，2
方式,03856995N，1
再次感谢，因为等级原因我只能发几个鱼币，希望海涵。

jackz007 发表于 2020-11-10 11:03:51

本帖最后由 jackz007 于 2020-11-10 13:53 编辑

fa , fb = open('a.txt') , open('b.txt')
da , db = list(fa) , list(fb)
fa . close() ; fb . close()
dc = * len(da)
for ax in range(1 , len(da)):
for bx in range(1 , len(db)):
   if db . strip() in da . strip() . split(','):
         dc += 1
with open('c.txt' , 'wt') as fc:
fc . write('词汇,编码,词频\n')
for ax in range(1 , len(da)):
   fc . write(da . strip() + ',' + str(dc) + '\n')

fall_bernana 发表于 2020-11-10 11:51:28

import re
dict1={}
with open ("B.txt","r",encoding="utf8") as file1:
lines=file1.readlines()
for line in lines:
   if re.search(r'\d+N',line.strip()):
         if line.strip() in dict1:
            dict1+=1
         else:
            dict1=1
with open ("C.txt","w",encoding="utf8") as file3:
file3.write("词汇，编码，词频\n")
with open ("A.txt","r",encoding="utf8") as file2:
   lines=file2.readlines()
   for line in lines:
         info=line.strip().split(',')
         if re.search(r'\d+N',info):
            if info in dict1:
               file3.write(line.strip()+","+str(dict1])+"\n")
               print(line.strip()+",",dict1])

Amgalang 发表于 2020-11-10 13:51:03

fall_bernana 发表于 2020-11-10 11:51

谢谢您的回复有点受宠若惊，再次感谢 {:10_275:}

Amgalang 发表于 2020-11-10 13:52:10

jackz007 发表于 2020-11-10 12:11

哇，真心感谢您了，我学到了很多，我刚看见一行能打开两个文件哈哈哈，再次感谢

Amgalang 发表于 2020-11-10 13:54:13

fall_bernana 发表于 2020-11-10 11:51

再次感谢{:10_275:}

页: [1]

鱼C论坛's Archiver

A文件里的词汇 在B文件中的词频统计

A文件里的词汇在B文件中的词频统计