[已解决]python 小甲鱼课程 Scrapy 部分的问题

此帐号已被注销 · 发表于 2020-3-5 18:58:58

您需要登录才可以下载或查看，没有账号？立即注册

x

在小甲鱼063课Scrapy中。出现了下面的疑问

我不太懂网页啥的，跪求路过大佬介绍一下

最佳答案

派生小生

2020-3-6 23:44:30

此帐号已被注销发表于 2020-3-5 19:42
不好意思，没说清楚。
在第一张图是用scrapy方法要爬到网页下各超链接的名称和他的网页结构，黑 ...

简单来说就是路径，比如：
我们电脑中的文件路径：
E:\app\Fiddler2 和 \E:\app\Fiddler2 这两个路径肯定是不一样的

而你图中的路径，就是网页各个元素的路径，有没"\"肯定不一样咯

zltzlt · 发表于 2020-3-5 19:00:01

什么疑问

一个账号 · 发表于 2020-3-5 19:01:38

什么问题？最好把问题描述清楚一点

此帐号已被注销 · 发表于 2020-3-5 19:42:23

不好意思，没说清楚。
在第一张图是用scrapy方法要爬到网页下各超链接的名称和他的网页结构，黑色笔圈起来的
第二张图使用cmd 运用scrapy方法爬取网站
大部分代码为

scrapy crawl dmoz
sites = sel.xpath('//div/div[@class="title-and-desc"]')
for site in sites:
title = site.xpath('a/div/text()').extract()
print(title)
#这样是正确的答案
#但是如果发生变化 title = site.xpath('a/div/text()').extract() -> title = site.xpath('/a/div/text()').extract()
#就会输出错误，且每次输出都是一样的
#问题：为什么发生上面的变化就输出错误， ‘/’这个符号起什么作用呢

复制代码

@一个账号 @zltzlt

wongyusing · 发表于 2020-3-6 23:16:33

复制代码

斜杠是根的意思。
在xpath中是代表从根节点开始选择。
这个问题随便搜一下就有啦

派生小生 · 发表于 2020-3-6 23:44:30

此帐号已被注销发表于 2020-3-5 19:42
不好意思，没说清楚。
在第一张图是用scrapy方法要爬到网页下各超链接的名称和他的网页结构，黑 ...

简单来说就是路径，比如：
我们电脑中的文件路径：
E:\app\Fiddler2 和 \E:\app\Fiddler2 这两个路径肯定是不一样的

而你图中的路径，就是网页各个元素的路径，有没"\"肯定不一样咯

账号		自动登录	找回密码
密码			立即注册