[已解决]scrapy 框架问题

kmh · 发表于 2016-4-3 17:47:44

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

kongminhaodeMacBook-Pro-2:jd komgminhao$ scrapy crawl jd
Traceback (most recent call last):
  File "/Library/Frameworks/Python.framework/Versions/2.7/bin/scrapy", line 11, in <module>
sys.exit(execute())
  File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/scrapy/cmdline.py", line 142, in execute
cmd.crawler_process = CrawlerProcess(settings)
  File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/scrapy/crawler.py", line 209, in __init__
super(CrawlerProcess, self).__init__(settings)
  File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/scrapy/crawler.py", line 115, in __init__
self.spider_loader = _get_spider_loader(settings)
  File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/scrapy/crawler.py", line 296, in _get_spider_loader
return loader_cls.from_settings(settings.frozencopy())
  File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/scrapy/spiderloader.py", line 30, in from_settings
return cls(settings)
  File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/scrapy/spiderloader.py", line 21, in __init__
for module in walk_modules(name):
  File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/scrapy/utils/misc.py", line 71, in walk_modules
submod = import_module(fullpath)
  File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/importlib/__init__.py", line 37, in import_module
__import__(name)
  File "/Users/komgminhao/Desktop/code/jd/jd/spiders/jd.py", line 2, in <module>
from jd.items import JdItem
ImportError: No module named items

文件items.py ：
import scrapy

class JdItem(scrapy.Item):
# define the fields for your item here like:
# name = scrapy.Field()
ooxx_image_url = scrapy.Field()
images = scrapy.Field()
文件 pipeline.py
from scrapy.pipeline.images import ImagesPipeline
from scrapy.exceptions import DropItem
from scrapy import Request

class JdPipeline(ImagesPipeline):
def get_media_requests(self,item,info):
for image_url in item['ooxx_image_url']:
yield Request(image_url)
def item_completed(self,result,item,info):
image_paths=[x['path'] for ok ,x in result if ok]
if  not image_paths:
raise DropItem('图片未下载好 %s'%image_paths)
文件jd.py:
import scrapy
from jd.items import JdItem
class jd(scrapy.Spider):
name = 'jd'
start_urls = ['http://jandan.net/ooxx']
def parse(self,response):
sel = scrapy.selector.Selector(response)
links = sel.xpath("//*[@id]/div[1]/div/div[2]/p/img")
img_url = links.xpath("@src").extract()
item = JdItem()
item['ooxx_image_url'] = img_url

yield item

文件settings.py：
BOT_NAME = 'jd'

SPIDER_MODULES = ['jd.spiders']
NEWSPIDER_MODULE = 'jd.spiders'
ITEM_PIPELINES={
'jd.pipelines.JdPipeline':1
}
IMAGES_STORE='/Users/komgminhao/Desktop/code/jd/jd/spiders'

IMAGES_EXPIRES = 90

最佳答案

月排行榜 / 总排行榜

ooxx7788

2017-3-7 11:16:51

项目名字和爬虫名字不要重复，不然就会出错！

跳转到最佳答案楼层

kmh · 发表于 2016-4-3 18:58:07

解决了：参考
http://stackoverflow.com/questio ... -module-named-items
请在改变完名字后删除.pyc文件，然后再输入scrapy crawl 爬虫名

不酱油 · 发表于 2016-4-4 00:56:16

yuzai1702 · 发表于 2017-1-20 14:43:45

H.B.F · 发表于 2017-1-22 10:54:03

666666666666

32269100 · 发表于 2017-3-7 10:52:02

看不懂呀

ooxx7788 · 发表于 2017-3-7 11:16:51

这个最佳答案由 ooxx7788 给出，感谢 ooxx7788 的回答。

单击隐藏图章

项目名字和爬虫名字不要重复，不然就会出错！

2131479626 · 发表于 2017-3-8 07:13:54

提示: 作者被禁止或删除内容自动屏蔽

保登心爱 · 发表于 2017-4-27 11:03:36

不会用啊---

ド゛゜范 · 发表于 2017-8-12 18:18:18

新手·ing · 发表于 2017-8-12 18:32:49

就当是福利贴了

shinemic · 发表于 2017-8-12 19:16:20

福利吧。。

whdd · 发表于 2018-9-30 19:43:45

GOD乌索普 · 发表于 2018-10-1 07:58:02

学习

学学看看 · 发表于 2018-10-8 11:10:05

提示: 作者被禁止或删除内容自动屏蔽

小小小菜菜菜 · 发表于 2018-12-20 10:14:28

学习下

账号		自动登录	找回密码
密码			立即注册

2131479626 2131479626 当前离线 UID 412965 日志相册贡献荣誉积分 29 狗仔卡头像被屏蔽	发表于 2017-3-8 07:13:54 \| 显示全部楼层回帖奖励 +2 鱼币提示: 作者被禁止或删除内容自动屏蔽
	小甲鱼最新课程 -> https://ilovefishc.com
	回复支持反对使用道具举报显身卡

学学看看学学看看当前离线 UID 522173 日志相册贡献荣誉积分 588 狗仔卡头像被屏蔽	发表于 2018-10-8 11:10:05 \| 显示全部楼层回帖奖励 +2 鱼币提示: 作者被禁止或删除内容自动屏蔽
	小甲鱼最新课程 -> https://ilovefishc.com
	回复使用道具举报显身卡

[已解决]scrapy 框架问题

马上注册，结交更多好友，享用更多功能^_^

回帖奖励 +2 鱼币

回帖奖励 +2 鱼币

回帖奖励 +2 鱼币

回帖奖励 +2 鱼币

回帖奖励 +2 鱼币

回帖奖励 +2 鱼币

回帖奖励 +2 鱼币

回帖奖励 +2 鱼币

回帖奖励 +2 鱼币

回帖奖励 +2 鱼币

回帖奖励 +2 鱼币

回帖奖励 +2 鱼币

回帖奖励 +2 鱼币

回帖奖励 +2 鱼币