鱼C论坛

 找回密码
 立即注册
查看: 967|回复: 16

[已解决]新手学SCRAPY遇到个问题求教大神Xpath方法弹出不来

[复制链接]
发表于 2018-9-21 21:09:08 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x

正常写好初始

正常写好初始

parsel方法里response弹不出xpath方法 卡住好久了

parsel方法里response弹不出xpath方法 卡住好久了


SCRAPY里 解析函数response.弹不出response.xpath 输入点没有.xpath提示
卡住好久了,求大神解疑
最佳答案
2018-9-22 08:31:45
from scrapy.selector import Selector

select = Selector(response)
select.xpath()
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2018-9-21 21:39:22 | 显示全部楼层
用的是PYCHARM,都是照着视频来的,不知道为什么弹不出xpath方法。哎
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-22 08:31:45 | 显示全部楼层    本楼为最佳答案   
from scrapy.selector import Selector

select = Selector(response)
select.xpath()
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-22 12:30:00 | 显示全部楼层
幽梦三影 发表于 2018-9-22 08:31
from scrapy.selector import Selector

select = Selector(response)

大神 非常感谢  谢谢了  ,刚按你方法可以出来了,但不知道为什么我看网上教程他直接response.就出来了xpath
C:\Users\Administrator\Desktop\QQ截图20180922122828.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-22 21:35:47 | 显示全部楼层
孤星破红尘 发表于 2018-9-22 12:30
大神 非常感谢  谢谢了  ,刚按你方法可以出来了,但不知道为什么我看网上教程他直接response.就出来了xp ...

朋友,又遇到一个问题了,用你这种方法已经获取到一个selector集合,然后遍历进一步提取,又弹不出.xpath了,不会每一步都要这样做吧,能帮忙解决一下嘛。谢谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-23 00:13:13 From FishC Mobile | 显示全部楼层
孤星破红尘 发表于 2018-9-22 21:35
朋友,又遇到一个问题了,用你这种方法已经获取到一个selector集合,然后遍历进一步提取,又弹不出.xpath ...

发个截图给我看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-23 01:40:33 From FishC Mobile | 显示全部楼层
weibos是个selector集合,遍历弹不出xpath   麻烦你了
2-3.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-23 01:42:13 From FishC Mobile | 显示全部楼层
孤星破红尘 发表于 2018-9-23 01:40
weibos是个selector集合,遍历弹不出xpath   麻烦你了

这张是获取到的weibos  selector集合
1-1.jpg
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-23 10:16:26 | 显示全部楼层
本帖最后由 幽梦三影 于 2018-9-23 10:22 编辑
孤星破红尘 发表于 2018-9-23 01:42
这张是获取到的weibos  selector集合


如果a标签下面有子节点的话可以再遍历,没有子节点就取完了。我才发现你呢个应该换成start_urls, scrapy会识别start_urls并进行访问,不过也可以重写start_requests方法
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-23 16:02:02 From FishC Mobile | 显示全部楼层
幽梦三影 发表于 2018-9-23 10:16
如果a标签下面有子节点的话可以再遍历,没有子节点就取完了。我才发现你呢个应该换成start_urls, scrapy ...

恩恩 那个我后来改过来了,也捕到了内容,朋友你再帮我看下这两张图片  他也没import别的模块  都能response. xpath,我在网上查了是有这样的响应方便的快捷键 response.x path  和response.css  不知道为什么我的scrapy就不行   麻烦了
Screenshot_20180923-155123.jpg
QQ礼20180923155331.jpg
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-23 16:42:29 | 显示全部楼层
孤星破红尘 发表于 2018-9-23 16:02
恩恩 那个我后来改过来了,也捕到了内容,朋友你再帮我看下这两张图片  他也没import别的模块  都能respo ...

把url地址发一下我看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-23 19:44:45 | 显示全部楼层
幽梦三影 发表于 2018-9-23 16:42
把url地址发一下我看看

https://tieba.baidu.com/f?kw=天行九歌&ie=utf-8&tab=album 抓取目标网址
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-23 19:59:35 | 显示全部楼层
我试了你的xpath取不到数据啊,你想取什么信息
H$)2[(N4_]K0HO)[X%CC0RT.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-23 20:07:26 | 显示全部楼层
幽梦三影 发表于 2018-9-23 19:59
我试了你的xpath取不到数据啊,你想取什么信息

我重新用贴吧相册来测试了 //a[@class="grbm_ele_a grbm_ele_big"]   这个a下面有每个相册的地址
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-23 20:20:01 | 显示全部楼层
# -*- coding: utf-8 -*-
import scrapy
from scrapy.selector import Selector

class JgSpider(scrapy.Spider):
    name = 'jg'
    # allowed_domains = ['tieba/baidu.com']
    start_urls = ['https://tieba.baidu.com/f?kw=%E5%A4%A9%E8%A1%8C%E4%B9%9D%E6%AD%8C&ie=utf-8&tab=album']

    def parse(self, response):
        select = Selector(response)
        img_link = select.xpath('//a[@class="grbm_ele_a grbm_ele_big"]/@href')
        for i in img_link:
            print(i.extract())
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-23 20:23:13 From FishC Mobile | 显示全部楼层
幽梦三影 发表于 2018-9-23 19:59
我试了你的xpath取不到数据啊,你想取什么信息

大神,我能加下你的qq嘛,这个问题困扰我好几天了,后面所有的想法都没法继续下去
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-23 20:28:27 | 显示全部楼层
好的1160576878
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-18 17:43

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表