鱼C论坛

 找回密码
 立即注册
查看: 1379|回复: 6

[已解决]求助大佬scrapy框架爬取问题

[复制链接]
发表于 2020-4-25 14:56:41 | 显示全部楼层 |阅读模式
15鱼币
本帖最后由 v.ki 于 2020-4-25 15:01 编辑

设置里加入了头,robots协议已经设置为fasle了

求助大佬为什么爬到了空气。。。应该怎么改
批注 2020-04-25 145448.png
import json
import scrapy
from ..items import PinduoduoItem
class PinduoduoSpider(scrapy.Spider):
    name='pinduoduo'
    allowed_domains=['yangkeduo.com']
    page=1
    start_url=['http://mobile.yangkeduo.com/proxy/api/api/alexa/goods/hub?pdduid=0&list_update_time=true&hs_version=2&wrt_type=1&'+'page='+str(page)+'&size=20'
               ]
    print(start_url)
    def parse(self,response):
        
        goods_list_json=json.loads(response.body)
        goods_list=goods_list_json['goods_list']
        if not goods_list:
            return 
        for i in goods_list:
            item=PinduoduoItem()
            item['goods_name']=i['goods_name']
            item['goods_id']=i['goods_id']
            yield scrapy.Request(url='http://mobile.yangkeduo.com/proxy/api/reviews/'+str(item['goods_id'])+'/list?page=1&size=10',\
                                 callback=self.get_comments,meta={'item':item})
            
        self.page+=1
    
        yield scrapy.Requests(url='http://mobile.yangkeduo.com/proxy/api/api/alexa/goods/hub?pdduid=0&list_update_time=true&hs_version=2&wrt_type=1&'+'page='+str(self.page)+'&size=20',\
                              callback=self.parse)
        
    def get_comments(self,response):
        print('哈哈哈')
最佳答案
2020-4-25 14:56:42
第8行 start_urls   加s

最佳答案

查看完整内容

第8行 start_urls 加s
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-4-25 14:56:42 | 显示全部楼层    本楼为最佳答案   
第8行 start_urls   加s
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-4-25 15:00:28 From FishC Mobile | 显示全部楼层
要爬哪个网站?
代码??
啥都不提供,就是问?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-4-25 15:01:26 | 显示全部楼层
wp231957 发表于 2020-4-25 15:00
要爬哪个网站?
代码??
啥都不提供,就是问?

拼多多,代码已经重新编辑
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-4-25 16:01:40 | 显示全部楼层
v.ki 发表于 2020-4-25 15:01
拼多多,代码已经重新编辑


小甲鱼的scrapy太老了……不太适合现在学习,我这边有一套教程,电邮多少,我给你
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-4-25 16:12:42 | 显示全部楼层
老八秘制 发表于 2020-4-25 16:01
小甲鱼的scrapy太老了……不太适合现在学习,我这边有一套教程,电邮多少,我给你

不是小甲鱼的视频,能不能帮我看下为什么没有爬到谢谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-4-25 16:56:03 | 显示全部楼层
qwgdmy 发表于 2020-4-25 16:30
第8行 start_urls   加s

我丢,我真他妈笨,意外意外,谢谢了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-26 20:47

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表