天下无敌小萨萨 发表于 2018-2-22 18:50:47

极客Python中小甲鱼的爬取豆瓣TOP205源码问题

在观看源码的过程中发现寻找页数的函数中有depth = soup.find('span', class_='next').previous_sibling.previous_sibling.text这样一个代码
随后自己去网站查询网页源码的过程中
发现
这样
previous_sibling这个意思不是遍历兄弟节点的上一个吗
如果要是获取十页,明显上一个的text就是10啊。为什么要用两次previous_sibling呢
这样不是成9了??但是很奇怪断点调试depth确实是10,而且如果少一个previous_sibling的话会报错
这是为什么呢,还是我理解错了呢

天下无敌小萨萨 发表于 2018-2-22 18:51:21

来人来人{:10_243:}

天下无敌小萨萨 发表于 2018-2-22 18:58:04

{:10_299:}{:10_299:}很急,在线等

Tony_C 发表于 2018-2-27 19:58:26

兄弟,我也遇到了这个问题,你要是知道了麻烦告诉我一下谢谢了~

waitforlove 发表于 2018-2-27 20:06:27

@小甲鱼

天下无敌小萨萨 发表于 2018-3-6 08:40:44

Tony_C 发表于 2018-2-27 19:58
兄弟,我也遇到了这个问题,你要是知道了麻烦告诉我一下谢谢了~

难受啊,我还不知道的呢,理解不了

天下无敌小萨萨 发表于 2018-3-6 08:41:50

waitforlove 发表于 2018-2-27 20:06
@小甲鱼

头像报警

天下无敌小萨萨 发表于 2018-3-6 08:43:05

来人啊

天下无敌小萨萨 发表于 2018-3-8 16:01:04

没人吗

天下无敌小萨萨 发表于 2018-3-10 10:15:33

来人来人

天下无敌小萨萨 发表于 2018-3-11 11:43:48

有人吗

小木船 发表于 2018-3-24 18:49:07

我也是有这个疑问,居然没有人回答?

天下无敌小萨萨 发表于 2018-3-27 21:12:41

小木船 发表于 2018-3-24 18:49
我也是有这个疑问,居然没有人回答?

我也奇怪。。而且到现在也没弄懂

别人家孩子 发表于 2018-9-16 20:04:00

上一个是换行“\n”,所以要再上一个

幽梦三影 发表于 2018-9-17 12:35:01

xpath多简单//a/text()

HISIOISIH 发表于 2018-10-16 15:37:07

写三遍也报错,好像必须双数,估计中间还有一行什么

塔利班 发表于 2018-10-16 15:55:10

的确是还有个换行,试着打印一个previous_sibling就知道了

154811490 发表于 2019-5-24 22:29:47

先赞一下

ljj19971222 发表于 2019-9-26 14:11:18

就是\n也算一个

AINIDEREN 发表于 2020-3-28 16:06:09

现在已经爬不了了
页: [1] 2
查看完整版本: 极客Python中小甲鱼的爬取豆瓣TOP205源码问题