鱼C论坛

 找回密码
 立即注册
查看: 11107|回复: 18

scrapy 出错 spider not found dmoz

[复制链接]
发表于 2015-10-12 20:04:22 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 上帝赐殊恩 于 2015-10-12 21:17 编辑

QQ截图20151012200257.png

按照教程中的步骤,dmoz_spider.py的文件路径在tutorial/tutorial/spiders下面,没有错。但是总是出出现上图中的错误,请问怎么解决?

谢谢!!!
QQ截图20151012211446.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2015-10-12 20:05:28 | 显示全部楼层
在线等!!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-10-12 20:22:23 | 显示全部楼层
请确保 name 属性的名字正确:

  1. import scrapy

  2. from tutorial.items import DmozItem

  3. class DmozSpider(scrapy.Spider):
  4.     name = "dmoz"
  5.     allowed_domains = ["dmoz.org"]
  6.     start_urls = [
  7.         "http://www.dmoz.org/Computers/Programming/Languages/Python/Books/",
  8.         "http://www.dmoz.org/Computers/Programming/Languages/Python/Resources/"
  9.     ]

  10.     def parse(self, response):
  11.         sel = scrapy.selector.Selector(response)
  12.         sites = sel.xpath('//ul[@class="directory-url"]/li')
  13.         items = []
  14.         for site in sites:
  15.             item = DmozItem()
  16.             item['title'] = site.xpath('a/text()').extract()
  17.             item['link'] = site.xpath('a/@href').extract()
  18.             item['desc'] = site.xpath('text()').extract()
  19.             items.append(item)

  20.         return items
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-10-12 21:14:44 | 显示全部楼层
name也是正确的,直接用的例子中的代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-10-12 21:15:24 | 显示全部楼层
小甲鱼 发表于 2015-10-12 20:22
请确保 name 属性的名字正确:

name也是正确的,没错。怎么办?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-7-9 16:57:09 | 显示全部楼层
我也遇到了同样的问题,楼主解决了吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-10-9 15:05:37 | 显示全部楼层
我也一样的,楼主解决了吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-10-10 07:20:00 | 显示全部楼层
解决了吗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-1-12 11:31:02 | 显示全部楼层
我也遇到同样的问题,看来是一个共性问题哦
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-1-15 18:26:54 | 显示全部楼层
解决了吗?好久了貌似..求答案
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-8 16:01:09 | 显示全部楼层
求大拿回答啊。。我也一样,LZ是不是python3
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-13 18:31:00 | 显示全部楼层
我也是一样的问题。。。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-15 09:22:03 | 显示全部楼层
求解决,我也是遇到了同样的问题,而且我写别的spider运行,也是发生这个问题。。。完全瘫痪了。。。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-24 11:32:20 | 显示全部楼层
cd tutorial 之后先 scrapy genspider dmoz dmoz.org, 然后再scrapy crawl dmoz,我这样是能运行出来的,小伙伴们可以试试
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 2 反对 0

使用道具 举报

发表于 2017-3-2 20:05:09 | 显示全部楼层
要转到spiders目录下运行
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-4-13 09:26:21 | 显示全部楼层
zjzjxx 发表于 2017-2-24 11:32
cd tutorial 之后先 scrapy genspider dmoz dmoz.org, 然后再scrapy crawl dmoz,我这样是能运行出来的,小 ...

好了。666
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-5-21 18:16:53 | 显示全部楼层
Traceback (most recent call last):
  File "/usr/local/bin/scrapy", line 7, in <module>
    from scrapy.cmdline import execute
  File "/usr/local/lib/python3.5/dist-packages/scrapy/cmdline.py", line 9, in <module>
    from scrapy.crawler import CrawlerProcess
  File "/usr/local/lib/python3.5/dist-packages/scrapy/crawler.py", line 7, in <module>
    from twisted.internet import reactor, defer
  File "/usr/local/lib/python3.5/dist-packages/twisted/internet/reactor.py", line 38, in <module>
    from twisted.internet import default
  File "/usr/local/lib/python3.5/dist-packages/twisted/internet/default.py", line 56, in <module>
    install = _getInstallFunction(platform)
  File "/usr/local/lib/python3.5/dist-packages/twisted/internet/default.py", line 44, in _getInstallFunction
    from twisted.internet.epollreactor import install
  File "/usr/local/lib/python3.5/dist-packages/twisted/internet/epollreactor.py", line 24, in <module>
    from twisted.internet import posixbase
  File "/usr/local/lib/python3.5/dist-packages/twisted/internet/posixbase.py", line 18, in <module>
    from twisted.internet import error, udp, tcp
  File "/usr/local/lib/python3.5/dist-packages/twisted/internet/tcp.py", line 28, in <module>
    from twisted.internet._newtls import (
  File "/usr/local/lib/python3.5/dist-packages/twisted/internet/_newtls.py", line 21, in <module>
    from twisted.protocols.tls import TLSMemoryBIOFactory, TLSMemoryBIOProtocol
  File "/usr/local/lib/python3.5/dist-packages/twisted/protocols/tls.py", line 41, in <module>
    from OpenSSL.SSL import Error, ZeroReturnError, WantReadError
  File "/usr/local/lib/python3.5/dist-packages/OpenSSL/__init__.py", line 8, in <module>
    from OpenSSL import rand, crypto, SSL
  File "/usr/local/lib/python3.5/dist-packages/OpenSSL/SSL.py", line 113, in <module>
    if _lib.Cryptography_HAS_SSL_ST:
AttributeError: module 'lib' has no attribute 'Cryptography_HAS_SSL_ST'

这是什么情况。。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-29 09:57:17 | 显示全部楼层
domz网站不是已经停止服务了吗。。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-7-25 17:28:05 | 显示全部楼层
zjzjxx 发表于 2017-2-24 11:32
**** 作者被禁止或删除 内容自动屏蔽 ****

太强了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-25 10:02

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表