大忽悠喵 发表于 2019-4-21 09:19:36

极客python豆瓣250中的一个代码问题

# 找出一共有多少个页面
def find_depth(res):
    soup = bs4.BeautifulSoup(res.text, 'html.parser')
    depth = soup.find('span', class_='next').previous_sibling.previous_sibling.text

    return int(depth)

这个函数是用来找top250一共有多少页的,soup.find('span', class_='next')是找出与下一页按钮对应的网页代码。后面的previous_sibling.previous_sibling.text不太理解,查了一下说是previous_sibling用于返回该节点的上一个节点,那为什么执行depth = soup.find('span', class_='next').previous_sibling.previous_sibling.text之后depth的值就是‘10’了呢,求大神解答。

_谪仙 发表于 2019-4-21 10:13:20

上一个平行标签,由于标签之间存在·空格,故一个previous_sibling便是空格,两个才是标签

大忽悠喵 发表于 2019-4-21 10:57:09

_谪仙 发表于 2019-4-21 10:13
上一个平行标签,由于标签之间存在·空格,故一个previous_sibling便是空格,两个才是标签

谢谢回答,还是有点不明白,标签中间存在空格是什么意思?比如说我现在在第一页,那上一个标签是啥?{:5_99:}求大佬解答

_谪仙 发表于 2019-4-21 11:04:12

<h1>...</h1>
<h2>...</h2>
假如查找h2标签,使用previous_sibling便是h1和h2之间的空格,使用previous_sibling.previous_sibling才是找到h1标签

大忽悠喵 发表于 2019-4-21 18:39:57

_谪仙 发表于 2019-4-21 11:04
假如查找h2标签,使用previous_sibling便是h1和h2之间的空格,使用previous_sibling.previous_sibling才 ...

明白了,原来这俩中间还有个空格啊
页: [1]
查看完整版本: 极客python豆瓣250中的一个代码问题