|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
# 找出一共有多少个页面
- def find_depth(res):
- soup = bs4.BeautifulSoup(res.text, 'html.parser')
- depth = soup.find('span', class_='next').previous_sibling.previous_sibling.text
- return int(depth)
复制代码
这个函数是用来找top250一共有多少页的,soup.find('span', class_='next')是找出与下一页按钮对应的网页代码。后面的previous_sibling.previous_sibling.text不太理解,查了一下说是previous_sibling用于返回该节点的上一个节点,那为什么执行depth = soup.find('span', class_='next').previous_sibling.previous_sibling.text之后depth的值就是‘10’了呢,求大神解答。
- <h1>...</h1>
- <h2>...</h2>
复制代码
假如查找h2标签,使用previous_sibling便是h1和h2之间的空格,使用previous_sibling.previous_sibling才是找到h1标签
|
|