鱼C论坛

 找回密码
 立即注册
查看: 1589|回复: 7

爬虫 京东评论数量(好评差评等) 求助!

[复制链接]
发表于 2019-5-14 17:39:22 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
如题 需要爬的是打勾的只看商品的评论数量

1.png


然后,看了一下preview和response,应该是在这个请求里面的!

2.png


然而!!在header里面的URL,打开确是一片空白。于是也爬不下来。
3.png


求解决啊!链接如下,找到的。

tps://club.jd.com/comment/skuProductPageComments.action?callback=fetchJSON_comment98vv587&productId=884953&score=0&sortType=5&page=0&pageSize=10&isShadowSku=0&fold=1
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-5-14 19:38:10 From FishC Mobile | 显示全部楼层
淘宝有专门的人负责反爬这块
估计京东也差不多
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-5-16 11:41:44 | 显示全部楼层
wp231957 发表于 2019-5-14 19:38
淘宝有专门的人负责反爬这块
估计京东也差不多

是的 隔了一天 试了下!能爬70条 然后又白板了。。。这种咋解决呢?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-5-16 11:49:16 From FishC Mobile | 显示全部楼层
翩跹叶惊鸿 发表于 2019-5-16 11:41
是的 隔了一天 试了下!能爬70条 然后又白板了。。。这种咋解决呢?

你得能分析出来对方到底是咋反爬的
这需要非常深的道行
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-5-16 11:58:00 | 显示全部楼层
用代理试试
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-5-17 13:34:14 | 显示全部楼层

  1. from urllib import request
  2. from scrapy import Selector

  3. HEADERS = {
  4.     "User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36"
  5. }

  6. URL = "https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&tn=baidu&wd=ip&oq=%25E8%25BF%2594%25E5%259B%259Eip%25E7%259A%2584%25E9%2593%25BE%25E6%258E%25A5&rsv_pq=e5a17cfe00014b10&rsv_t=5993umDkwnBVwHfvkG5mjUfxl3tIsuYYNEmgOS9Ba%2BJgZUIkdvrS2t%2FJq%2B4&rqlang=cn&rsv_enter=1&inputT=621&rsv_sug3=102&rsv_sug1=78&rsv_sug7=100&rsv_sug2=0&rsv_sug4=621"

  7. proxy = {"http": "112.85.130.124:9999"}
  8. proxy_handler = request.ProxyHandler(proxy)
  9. opener = request.build_opener(proxy_handler)
  10. req = request.Request(URL,headers=HEADERS)
  11. res = opener.open(req).read()

  12. a = Selector(text=res).xpath('//span[@class="c-gap-right"]/text()').extract()
  13. print(a)
复制代码



为啥出来的永远是我本地的ip,求救。。。第一次用代理。。。


小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-5-17 14:50:53 | 显示全部楼层
用selenium。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-5-30 16:48:21 | 显示全部楼层

这是什么?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-1-15 18:48

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表