小甲鱼的铁粉 发表于 2021-2-3 19:30:18

有木有鱼油懂这个的

同学们好,这次的任务需要大家利用爬虫技术爬取综艺节目《百变大咖秀》的节目评论(至少1400条),并对爬取到的评论进行数据分析。对爬取的评论进行分词处理我们可以绘制词云图,分析每一条评论的发出时间,我们可以绘制一个观看时间区间统计图。除这两个图外,同学们也可以自由发挥,比如绘制一天内不同时间段观众评论数量统计图、每一天评论总数统计图等。图片示例如下:

这个评论进行分词处理分词处理是什么?用什么实现呢{:10_266:}

hrp 发表于 2021-2-3 19:40:44

结巴分词,pip install jieba

wp231957 发表于 2021-2-3 19:41:50

wordcloud搜一下

小甲鱼的铁粉 发表于 2021-2-3 19:46:31

hrp 发表于 2021-2-3 19:40
结巴分词,pip install jieba

了解了{:10_275:}

qiuyouzhi 发表于 2021-2-3 19:46:44

可以参考下这个
https://fishc.com.cn/thread-175409-1-1.html
页: [1]
查看完整版本: 有木有鱼油懂这个的