极客Python中小甲鱼的爬取豆瓣TOP205源码问题,Python交流,编程语言专区,鱼C论坛

天下无敌小萨萨 发表于 2018-2-22 18:50:47

极客Python中小甲鱼的爬取豆瓣TOP205源码问题

在观看源码的过程中发现寻找页数的函数中有depth = soup.find('span', class_='next').previous_sibling.previous_sibling.text这样一个代码
随后自己去网站查询网页源码的过程中
发现
这样
previous_sibling这个意思不是遍历兄弟节点的上一个吗
如果要是获取十页，明显上一个的text就是10啊。为什么要用两次previous_sibling呢
这样不是成9了？？但是很奇怪断点调试depth确实是10，而且如果少一个previous_sibling的话会报错
这是为什么呢，还是我理解错了呢

天下无敌小萨萨 发表于 2018-2-22 18:51:21

来人来人{:10_243:}

天下无敌小萨萨 发表于 2018-2-22 18:58:04

{:10_299:}{:10_299:}很急，在线等

Tony_C 发表于 2018-2-27 19:58:26

兄弟，我也遇到了这个问题，你要是知道了麻烦告诉我一下谢谢了~

waitforlove 发表于 2018-2-27 20:06:27

@小甲鱼

天下无敌小萨萨 发表于 2018-3-6 08:40:44

Tony_C 发表于 2018-2-27 19:58
兄弟，我也遇到了这个问题，你要是知道了麻烦告诉我一下谢谢了~

难受啊，我还不知道的呢，理解不了

天下无敌小萨萨 发表于 2018-3-6 08:41:50

waitforlove 发表于 2018-2-27 20:06
@小甲鱼

头像报警

天下无敌小萨萨 发表于 2018-3-6 08:43:05

来人啊

天下无敌小萨萨 发表于 2018-3-8 16:01:04

没人吗

天下无敌小萨萨 发表于 2018-3-10 10:15:33

来人来人

天下无敌小萨萨 发表于 2018-3-11 11:43:48

有人吗

小木船 发表于 2018-3-24 18:49:07

我也是有这个疑问，居然没有人回答？

天下无敌小萨萨 发表于 2018-3-27 21:12:41

小木船发表于 2018-3-24 18:49
我也是有这个疑问，居然没有人回答？

我也奇怪。。而且到现在也没弄懂

别人家孩子 发表于 2018-9-16 20:04:00

上一个是换行“\n”，所以要再上一个

幽梦三影 发表于 2018-9-17 12:35:01

xpath多简单//a/text()

HISIOISIH 发表于 2018-10-16 15:37:07

写三遍也报错，好像必须双数，估计中间还有一行什么

塔利班 发表于 2018-10-16 15:55:10

的确是还有个换行，试着打印一个previous_sibling就知道了

154811490 发表于 2019-5-24 22:29:47

先赞一下

ljj19971222 发表于 2019-9-26 14:11:18

就是\n也算一个

AINIDEREN 发表于 2020-3-28 16:06:09

现在已经爬不了了

页: [1] 2

鱼C论坛's Archiver

极客Python中小甲鱼的爬取豆瓣TOP205源码问题