爬取豆瓣TOP250电影代码求助,萌新交流区,萌新训练营,鱼C论坛

美味越光米 发表于 2019-4-3 10:38:04

爬取豆瓣TOP250电影代码求助

本帖最后由美味越光米于 2019-4-3 10:41 编辑

极客Python之效率革命中的爬去豆瓣TOP250电影中，小甲鱼找一共有多少个页面的方法有点不能理解，求大佬解释！
# 找出一共有多少个页面
def find_depth(res):
soup = bs4.BeautifulSoup(res.text, 'html.parser')
tag = soup.find('span', class_='next')
depth = tag.previous_sibling.previous_sibling.text
这里为什么用tag.previous_sibling.previous_sibling.text就可找到一共有多少个页面啊？

_谪仙 发表于 2019-4-3 11:59:39

因为标签中存在空格，如果只用一个previous_sibling，找到的标签是空格

页: [1]

鱼C论坛's Archiver

爬取豆瓣TOP250电影代码求助