首先,我们需要理解一下什么是词频。词频(Word Frequency)指的是一个词在文本中出现的频率。通常情况下,我们可以通过统计每个词在文本中出现的次数来计算词频。
那么,如何编写代码来实现词频统计呢?我们可以使用Python语言来完成这个任务。
以下是一个简单的示例代码:
def word_frequency(text):
# 将文本转换为小写,并去除标点符号
text = text.lower().replace('.', '').replace(',', '').replace('!', '').replace('?', '')
# 将文本按照空格分割成单词列表
words = text.split()
# 使用字典来记录每个单词的出现次数
frequency = {}
# 遍历单词列表,统计每个单词的出现次数
for word in words:
if word in frequency:
frequency[word] += 1
else:
frequency[word] = 1
return frequency
# 测试
text = "I love programming. Programming is fun!"
result = word_frequency(text)
print(result)
运行上述代码,输出结果为:{'i': 1, 'love': 1, 'programming': 2, 'is': 1, 'fun': 1}
可以看到,程序成功统计了文本中每个单词的词频。
希望以上代码能够帮助到你!如果有任何问题,请随时提问。
以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。 |