| 
 | 
 
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册  
 
x
 
# -*- coding: utf-8 -*- 
import scrapy 
import re 
from musicSpider.items import MusicspiderItem      #这里引入时MusicspiderItem下面油条红色波浪线,但是要是输入from MusicspiderItem.musicSpider.items import MusicspiderItem虽然都显示正常了,但是在执行scrapy crawl muSpider -o mu.json生成json文件时提示No module named 'musicSpider.musicSpider 
 
class MuspiderSpider(scrapy.Spider): 
    name = 'muSpider' 
    allowed_domains = ['http://www.htqyy.com'] 
    start_urls = ['http://www.htqyy.com/top/musicList/hot?pageIndex=0&pageSize=20'] 
 
    def parse(self, response): 
        data = response.body.decode() 
 
        items = [] 
        titles = re.findall(r'target="play" title="(.*?)"', data)  # 获取所有歌曲名 
        artist = re.findall(r'<a href="/artist/\\d+" title="(.*?)" target="_blank">', data)  # 获取所有艺术家名 
        for i in range(0, len(titles)): 
            item = MusicspiderItem() 
            item['titles'] = titles[i] 
            item['artist'] = artist[i] 
 
            items.append(item) 
 
        return items
你的文件夹应该类似这种结构吧 
开始的文件夹样式 
 
使用pycharm打开后,对外层的那个musicSpider文件夹右键,Mark Directory as >  Sources Root,外层文件夹变成蓝色就可以正常import了。
 
右键设置 
 
外层文件夹为蓝色即可 
 
 
 
 
 |   
 
 
 
 |