使用scrapy crawl dmoz -o xx.json 为什么抓取不到数据

dark也要学习 · 发表于 2019-12-11 15:32:00

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

import scrapy

from tutorial.items import DmozItem

class DmozSpider(scrapy.Spider):
name = "dmoz"
allowed_domains = ["cloud.tencent.com"]
start_urls = [
      "https://cloud.tencent.com/developer/ask/130402/"
]

def parse(self, response):
      sel = scrapy.selector.Selector(response)
      sites = sel.xpath('//ul[@class="c-nav-list"]/li')
      items = []
      for site in sites:
         item = DmozItem()
         item['title'] = site.xpath('a/text()').extract()
         item['link'] = site.xpath('a/@href').extract()
         item['desc'] = site.xpath('text()').extract()
         items.append(item)

      return items

空青 · 发表于 2019-12-11 17:05:28

你这个url进去都每东西啊

https://cloud.tencent.com/developer/ask/130402/

Stubborn · 发表于 2019-12-11 18:44:24

直接return item 顺便打印一下，有没有数据

账号		自动登录	找回密码
密码			立即注册

使用scrapy crawl dmoz -o xx.json 为什么抓取不到数据

马上注册，结交更多好友，享用更多功能^_^

回帖奖励 +10 鱼币

浏览过的版块