鱼C论坛

 找回密码
 立即注册
查看: 51080|回复: 306

[作品展示] 【python爬虫应用】爬京东上的小米5的2600多条差评数据之词频分析

  [复制链接]
发表于 2016-10-24 21:23:18 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
昨天写了一篇关于“爬京东上的小米5的2600多条差评数据" 的帖子,传送门

爬京东上的小米5的2600多条差评数据

今天,就继续讲讲爬到这些数据以后,我们如何进行分析,顺便看看小米5的主要问题有哪些。

先上结果,我列了前10项:
无标题.png
有兴趣的鱼油还可以通过筛选出来的词频,画词云图

源代码如下:
游客,如果您要查看本帖隐藏内容请回复
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2016-10-24 22:49:01 | 显示全部楼层
jsjyyjs 发表于 2016-10-24 22:34
怎么爬的,网站的API接口怎么连接

代码里有的,网站返回的就是一个json格式的数据。稍微提炼一下,直接导入json中就能用。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-11-6 23:53:39 From FishC Mobile | 显示全部楼层
房间里的大象 发表于 2016-11-6 21:15
楼主 你学了多久才能把这个程序写出来的啊。

python的爬虫不难啊,我到现在一共学习python2个月的时间。我觉得python真正难的是它的各种库的运用,它的库实在太多了…
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-11-13 20:57:25 | 显示全部楼层
这个词频分析可以用collections.Counter更方便,我写的代码纯粹自己玩玩,还有很多可以优化的。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-11-19 16:15:52 | 显示全部楼层
alltolove 发表于 2016-11-19 15:31
卧槽!小米手机还有法要吗

其实我到不这么看,每个牌子的手机总会有质量问题的,从小米的差评分析来看,它的很多问题是和京东的客服或者快递有关,真正的质量问题的比例反而不是很高,而且基本上也就是手机发热等等这种其他手机也会有的问题。所以说这反而可以说明小米手机的质量还是不错的。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-10-24 05:44

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表