鱼C论坛

 找回密码
 立即注册
查看: 1115|回复: 5

[已解决]python 小甲鱼课程 Scrapy 部分的问题

[复制链接]
发表于 2020-3-5 18:58:58 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
在小甲鱼063课Scrapy中。出现了下面的疑问 我不太懂网页啥的,跪求路过大佬介绍一下
2020-03-05.png DXHXWLX@M3~4[[YVAYAZJ.png
最佳答案
2020-3-6 23:44:30
此帐号已被注销 发表于 2020-3-5 19:42
不好意思,没说清楚。
在第一张图是用scrapy方法要爬到网页下各超链接的名称和他的网页结构,黑 ...

简单来说就是路径,比如:
我们电脑中的文件路径:
E:\app\Fiddler2 和 \E:\app\Fiddler2 这两个路径肯定是不一样的

而你图中的路径,就是网页各个元素的路径,有没"\"肯定不一样咯
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-3-5 19:00:01 | 显示全部楼层
什么疑问
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-5 19:01:38 | 显示全部楼层
什么问题?最好把问题描述清楚一点
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-3-5 19:42:23 | 显示全部楼层
不好意思,没说清楚。
在第一张图是用scrapy方法要爬到网页下各超链接的名称和他的网页结构,黑色笔圈起来的
第二张图使用cmd 运用scrapy方法爬取网站
大部分代码为
  1. scrapy crawl dmoz
  2. sites = sel.xpath('//div/div[@class="title-and-desc"]')
  3. for site in sites:
  4.     title = site.xpath('a/div/text()').extract()
  5.     print(title)

  6. #这样是正确的答案
  7. #但是如果发生变化 title = site.xpath('a/div/text()').extract() -> title = site.xpath('/a/div/text()').extract()
  8. #就会输出错误,且每次输出都是一样的
  9. #问题:为什么发生上面的变化就输出错误 , ‘/’这个符号起什么作用呢
  10.   
复制代码

@一个账号 @zltzlt
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-6 23:16:33 | 显示全部楼层
  1. /
复制代码

斜杠是根的意思。
在xpath中是代表从根节点开始选择。
这个问题随便搜一下就有啦
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-6 23:44:30 | 显示全部楼层    本楼为最佳答案   
此帐号已被注销 发表于 2020-3-5 19:42
不好意思,没说清楚。
在第一张图是用scrapy方法要爬到网页下各超链接的名称和他的网页结构,黑 ...

简单来说就是路径,比如:
我们电脑中的文件路径:
E:\app\Fiddler2 和 \E:\app\Fiddler2 这两个路径肯定是不一样的

而你图中的路径,就是网页各个元素的路径,有没"\"肯定不一样咯
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-18 23:05

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表