极客Python中小甲鱼的爬取豆瓣TOP205源码问题
在观看源码的过程中发现寻找页数的函数中有depth = soup.find('span', class_='next').previous_sibling.previous_sibling.text这样一个代码随后自己去网站查询网页源码的过程中
发现
这样
previous_sibling这个意思不是遍历兄弟节点的上一个吗
如果要是获取十页,明显上一个的text就是10啊。为什么要用两次previous_sibling呢
这样不是成9了??但是很奇怪断点调试depth确实是10,而且如果少一个previous_sibling的话会报错
这是为什么呢,还是我理解错了呢 来人来人{:10_243:} {:10_299:}{:10_299:}很急,在线等 兄弟,我也遇到了这个问题,你要是知道了麻烦告诉我一下谢谢了~ @小甲鱼 Tony_C 发表于 2018-2-27 19:58
兄弟,我也遇到了这个问题,你要是知道了麻烦告诉我一下谢谢了~
难受啊,我还不知道的呢,理解不了 waitforlove 发表于 2018-2-27 20:06
@小甲鱼
头像报警 来人啊 没人吗 来人来人 有人吗 我也是有这个疑问,居然没有人回答? 小木船 发表于 2018-3-24 18:49
我也是有这个疑问,居然没有人回答?
我也奇怪。。而且到现在也没弄懂 上一个是换行“\n”,所以要再上一个 xpath多简单//a/text() 写三遍也报错,好像必须双数,估计中间还有一行什么 的确是还有个换行,试着打印一个previous_sibling就知道了 先赞一下 就是\n也算一个 现在已经爬不了了
页:
[1]
2