鱼C论坛

 找回密码
 立即注册
查看: 3226|回复: 5

[已解决]英文词频统计

[复制链接]
发表于 2023-7-1 09:31:45 | 显示全部楼层
要进行多个单词的词频统计,您可以使用Python中的字符串处理和计数功能来实现。下面是一个示例代码,使用Python中的Counter类来实现多个单词的词频统计:

  1. from collections import Counter

  2. def word_frequency(text, words):
  3.     # 将文本中的标点符号替换为空格
  4.     text = text.replace(",", " ").replace(".", " ").replace("!", " ").replace("?", " ").replace(";", " ")

  5.     # 将文本拆分为单词列表
  6.     word_list = text.split()

  7.     # 统计单词出现的频率
  8.     word_counts = Counter(word_list)

  9.     # 提取指定单词的词频统计结果
  10.     result = {word: word_counts[word] for word in words}

  11.     return result

  12. # 示例文本
  13. text = "Climate change is a serious issue. Climate action is needed to mitigate its effects."

  14. # 指定需要统计的单词列表
  15. words = ["climate", "change", "action"]

  16. # 进行词频统计
  17. frequency_result = word_frequency(text.lower(), words)

  18. # 打印结果
  19. for word, count in frequency_result.items():
  20.     print(f"Word: {word}, Count: {count}")
复制代码

在上述示例中,我们定义了一个word_frequency()函数,它接受一个文本内容和一个需要统计的单词列表作为参数。首先,我们通过替换标点符号,并将文本拆分为单词列表。然后,我们使用Counter类来统计每个单词出现的次数,并将结果存储在一个字典中。最后,我们提取指定单词的词频统计结果,并打印出来。

请注意,示例代码中将文本转换为小写字母以进行不区分大小写的统计。如果您希望区分大小写,请将text.lower()改为text。

希望这可以帮助到您!如果您有任何其他问题,请随时向我提问。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-9-22 17:04

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表