有木有鱼油懂这个的
同学们好,这次的任务需要大家利用爬虫技术爬取综艺节目《百变大咖秀》的节目评论(至少1400条),并对爬取到的评论进行数据分析。对爬取的评论进行分词处理我们可以绘制词云图,分析每一条评论的发出时间,我们可以绘制一个观看时间区间统计图。除这两个图外,同学们也可以自由发挥,比如绘制一天内不同时间段观众评论数量统计图、每一天评论总数统计图等。图片示例如下:这个评论进行分词处理分词处理是什么?用什么实现呢{:10_266:} 结巴分词,pip install jieba wordcloud搜一下 hrp 发表于 2021-2-3 19:40
结巴分词,pip install jieba
了解了{:10_275:} 可以参考下这个
https://fishc.com.cn/thread-175409-1-1.html
页:
[1]