鱼C论坛

 找回密码
 立即注册
查看: 2124|回复: 5

[已解决]scrapy: 我的xpath写错了吗?运行时啥也没有

[复制链接]
发表于 2020-10-30 19:47:30 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
我的XPATH路径写错吗?运行啥也没有。
我想爬取糗事百科的段子当练习。
麻烦各位大神帮帮我。

0039.PNG
0040.PNG
最佳答案
2020-10-31 11:25:26
div_list = response.xpath('//div[@class="col1 old-style-col1“]/div')   --->div_list = response.xpath('//div[@class="col1 old-style-col1"]/div')
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-10-30 19:50:33 | 显示全部楼层
本帖最后由 青松100 于 2020-10-30 20:35 编辑

author 拼写错了,我改好了。但再运行,还是啥结果也没有,也没有报错!

我又发现第二个问题: 10行的引号写错了

能不能麻烦大神看看第10行啊? 我打印10行,什么结果也没有。
import scrapy


class QiubaiSpider(scrapy.Spider):
    name = 'qiubai'
    #allowed_domains = ['www.xxx.com']
    start_urls = ['https://www.qiushibaike.com/text/']

    def parse(self, response):
        div_list = response.xpath('//div[@class="col1 old-style-col1“]/div')
        for div in div_list:
            #authtor = div.xpath('./div[@class="author clearfix"]/a[2]/h2/text()')[0].extract()
            author = div.xpath('./div[1]/a[2]/h2/text()')[0].extract()
            content = div.xpath('./a[1]/div/span//text()').extract()
            print(author, content)
            break
            

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-10-30 22:22:42 | 显示全部楼层
@suchocolate
能不能再帮我看看啊? 谢谢。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-10-31 11:25:26 | 显示全部楼层    本楼为最佳答案   
div_list = response.xpath('//div[@class="col1 old-style-col1“]/div')   --->div_list = response.xpath('//div[@class="col1 old-style-col1"]/div')

评分

参与人数 1荣誉 +1 鱼币 +1 收起 理由
青松100 + 1 + 1 鱼C有你更精彩^_^

查看全部评分

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-10-31 11:52:07 | 显示全部楼层
Stubborn 发表于 2020-10-31 11:25
div_list = response.xpath('//div[@class="col1 old-style-col1“]/div')   --->div_list = response.xpat ...

非常感谢大佬的帮助。

之前我在发帖之前,引号是写错了,后来发帖后,我又观察到这个引号是错的。直接在帖子里修改了,然后我去VS CODE把代码改好,代码里写的双引号是英语的,也就说明是对的。

我又运行了一下,还是啥结果都没有。

我再等看看,有没有人帮我,如果实在没人帮上,我就采纳您为最佳。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-10-31 23:01:21 | 显示全部楼层
Stubborn 发表于 2020-10-31 11:25
div_list = response.xpath('//div[@class="col1 old-style-col1“]/div')   --->div_list = response.xpat ...

万分感谢您的帮助,在您的指导下,我的代码终于跑起来了。

由于我的记性太差 + 小白,忘了老师教的运行的命令是scrapy crawl + 爬虫名字 ,我在编译器里,按运行,难怪没有结果。我也真是太蠢了。

后来又出错了,不过我百度了方法,没有解决。后来我总算知道了问题所在。

开心!


想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-18 00:43

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表