我为学习而疯狂 发表于 2023-6-10 14:33:50

为什么我的textrank返回是空值

本帖最后由 我为学习而疯狂 于 2023-6-10 14:36 编辑

#奥林匹克项目词云图
import pandas as pd
import numpy as np
import matplotlib.pylab as plt
from pyecharts.charts import WordCloud
from jieba import analyse
from PIL import Image
textrank=analyse.textrank
############################################
#1
#df['Sport'].to_csv('sport.txt',index=False,header=False)
data=open('sport.txt','r',encoding='ASCII').read()
print(type(data))
keywords=textrank(data,topK=20,withWeight=True)
print(keywords)

我为学习而疯狂 发表于 2023-6-10 14:35:37

1

本帖最后由 我为学习而疯狂 于 2023-6-10 14:36 编辑

1

isdkz 发表于 2023-6-10 14:37:02

从你的代码中我可以看出,你试图使用jieba库中的textrank方法对从文件中读取的文本数据进行关键词提取。你的textrank返回为空值,可能有以下几种原因:

1. 数据问题:'sport.txt'文件可能为空,或者它的内容无法正确读取。在你的代码中,你使用的是'ASCII'编码来读取文件,这可能会在文件中包含非ASCII字符时引发问题。你可以试试使用'utf-8'编码来读取文件。

2. textrank参数问题:你为textrank方法设置了topK=20,意味着你想要提取前20个关键词。如果你的文本数据中含有的独立词汇数量少于20个,这可能会引发问题。你可以试试减小topK的值,或者不设定这个值,让它使用默认值。

3. jieba库的问题:textrank可能需要一些内部资源才能正常工作,例如停用词表或词性标注工具。如果这些资源在你的环境中不可用,可能会导致问题。你可以试试更新jieba库,或者检查一下你的环境是否有这些资源。

希望上述建议能帮助你解决问题,如果问题仍然存在,我建议你提供更多的上下文信息,比如错误信息、运行环境等,这样可以更好地定位问题。
页: [1]
查看完整版本: 为什么我的textrank返回是空值