liyan8866
发表于 2017-4-20 20:27:18
爬取京东iphone 7 pluse 100页详细评论信息
本人爬虫新手,自学写了一个爬取京东iphone 7 pluse 100页详细评论信息的爬虫代码,评论一页有10条,爬取100页共1000条,主要包阔如下信息:用户,等级,地区,评分,评论,时间,手机颜色,存储空间,客户端。
感觉爬1000条挺顺利,所以没有用代理和time.sleep,爬取得信息写入文档jingdong.txt中,结果如下图:
有一个问题就是,由于京东第一页评论中有一条评论有bug,没有写手机存储大小,所以也抓取不到信息,本人不知如何解决,就加了一个判断让这条信息补全为‘None’。
有什么宝贵意见希望大家批评指正!
听说大家都是回复可见,哈哈哈哈!
**** Hidden Message *****
py一学到底
发表于 2017-4-20 20:58:47
qiang
Kal
发表于 2017-4-20 21:52:03
可以
,不会爬,不敢说自己会代码
guolimin
发表于 2017-4-20 22:45:38
66666666
gopythoner
发表于 2017-4-20 23:44:19
抓不全的信息可以使用try
xurunhe
发表于 2017-4-21 06:54:00
看下吧,刚好学习
不要种草莓
发表于 2017-4-21 09:24:58
厉害啊
Kua.Max
发表于 2017-4-21 10:14:34
{:5_107:}
ooxx7788
发表于 2017-4-21 11:32:07
学习学习!
ndm123
发表于 2017-4-21 11:45:48
{:5_90:}
iwind
发表于 2017-4-21 13:22:55
强
东爷
发表于 2017-4-21 14:30:37
谢谢楼主
ypxyz123
发表于 2017-4-21 15:37:48
厉害
文人心梦
发表于 2017-4-21 16:48:08
过来学习了
ggshen
发表于 2017-4-21 17:52:03
23333333333333333333333333
一个小兵
发表于 2017-4-21 17:54:39
赞
tmkuej
发表于 2017-4-21 18:05:31
可以
,不会爬,不敢说自己会代码
yoyodj
发表于 2017-4-22 20:45:33
{:5_91:}
过期的牛奶
发表于 2017-4-23 19:39:54
来学习一下
清风揽月shine
发表于 2017-4-24 08:14:40
楼主这个太乱了能把信息归类整齐就好了评价分等级刚好可以做个市场调查了