|
发表于 2023-7-4 17:41:58
|
显示全部楼层
本楼为最佳答案
要获取自定义词表A中每个英文词组在文件B中的词频,可以按照以下步骤进行:
1. 读取文件A和文件B的内容。
2. 将文件A中的每个词组作为关键词,遍历文件B中的每个单词,并统计每个关键词在文件B中出现的次数。
3. 将每个关键词及其对应的词频保存起来,可以使用字典(dictionary)来存储。
4. 输出每个关键词及其对应的词频。
下面是一个示例代码,演示如何实现上述步骤:
- def get_word_frequency(fileA, fileB):
- # 读取文件A和文件B的内容
- with open(fileA, 'r') as f:
- keywords = f.read().splitlines()
- with open(fileB, 'r') as f:
- content = f.read()
- # 统计每个关键词在文件B中出现的次数
- word_frequency = {}
- for keyword in keywords:
- count = content.count(keyword)
- word_frequency[keyword] = count
- # 输出每个关键词及其对应的词频
- for keyword, count in word_frequency.items():
- print(f"{keyword}: {count}")
- return word_frequency
- # 示例用法
- fileA = 'path/to/fileA.txt'
- fileB = 'path/to/fileB.txt'
- word_frequency = get_word_frequency(fileA, fileB)
复制代码
请确保将 fileA 和 fileB 替换为实际的文件路径。运行上述代码后,将会输出每个关键词及其在文件B中的词频。 |
|