|
发表于 2024-2-26 23:28:11
|
显示全部楼层
首先,我们需要理解一下什么是词频。词频(Word Frequency)指的是一个词在文本中出现的频率。通常情况下,我们可以通过统计每个词在文本中出现的次数来计算词频。
那么,如何编写代码来实现词频统计呢?我们可以使用Python语言来完成这个任务。
以下是一个简单的示例代码:
- def word_frequency(text):
- # 将文本转换为小写,并去除标点符号
- text = text.lower().replace('.', '').replace(',', '').replace('!', '').replace('?', '')
- # 将文本按照空格分割成单词列表
- words = text.split()
- # 使用字典来记录每个单词的出现次数
- frequency = {}
- # 遍历单词列表,统计每个单词的出现次数
- for word in words:
- if word in frequency:
- frequency[word] += 1
- else:
- frequency[word] = 1
- return frequency
- # 测试
- text = "I love programming. Programming is fun!"
- result = word_frequency(text)
- print(result)
复制代码
运行上述代码,输出结果为:
- {'i': 1, 'love': 1, 'programming': 2, 'is': 1, 'fun': 1}
复制代码
可以看到,程序成功统计了文本中每个单词的词频。
希望以上代码能够帮助到你!如果有任何问题,请随时提问。
以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。 |
|