设为首页收藏本站

切换到窄版

鱼C论坛»论坛 › 编程语言专区 › Python交流 › Python问题求助

发新帖

查看: 2940|回复: 1

[已解决]Python问题求助

段段努力秃头

发表于 2020-11-19 20:40:37 | 显示全部楼层 |阅读模式

30鱼币

1, 读取bookcomments的内容（文档在附件中）

2 对读取内容处理（去除标点，处理重复的评论）（使用正则表达式相关方法进行处理）

3 完成分词操作

4 生成词云

最佳答案

月排行榜 / 总排行榜

逃兵

2020-11-19 20:40:38

是这样吗

import re
import jieba
import wordcloud
f = open('bookComments.txt') #读取
textlist=[]
reg = "[^0-9A-Za-z\u4e00-\u9fa5]" #标点
for eachline in f.readlines():
eachline = re.sub(reg,'',eachline) #去除标点
textlist.append(eachline)
textlist=list(set(textlist)) #去重
text = ''.join(textlist)
w = wordcloud.WordCloud(width=1000,\
font_path="msyh.ttc",height=700)
w.generate(" ".join(jieba.lcut(text)))
w.to_file("词云.png")

复制代码

跳转到最佳答案楼层

bookComments.rar

16.94 KB, 下载次数: 2

里面是bookcomments文档

最佳答案

查看完整内容

是这样吗

小甲鱼最新课程 -> https://ilovefishc.com

回复

使用道具举报

发表于 2020-11-19 20:40:38 | 显示全部楼层本楼为最佳答案

这个最佳答案由逃兵给出，感谢逃兵的回答。

单击隐藏图章

是这样吗

import re
import jieba
import wordcloud
f = open('bookComments.txt') #读取
textlist=[]
reg = "[^0-9A-Za-z\u4e00-\u9fa5]" #标点
for eachline in f.readlines():
eachline = re.sub(reg,'',eachline) #去除标点
textlist.append(eachline)
textlist=list(set(textlist)) #去重
text = ''.join(textlist)
w = wordcloud.WordCloud(width=1000,\
font_path="msyh.ttc",height=700)
w.generate(" ".join(jieba.lcut(text)))
w.to_file("词云.png")

复制代码

小甲鱼最新课程 -> https://ilovefishc.com

回复

使用道具举报

发新帖

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-8-2 09:20

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表