爬取豆瓣TOP250电影代码求助
本帖最后由 美味越光米 于 2019-4-3 10:41 编辑极客Python之效率革命中的爬去豆瓣TOP250电影中,小甲鱼找一共有多少个页面的方法有点不能理解,求大佬解释!
# 找出一共有多少个页面
def find_depth(res):
soup = bs4.BeautifulSoup(res.text, 'html.parser')
tag = soup.find('span', class_='next')
depth = tag.previous_sibling.previous_sibling.text
这里为什么用tag.previous_sibling.previous_sibling.text就可找到一共有多少个页面啊? 因为标签中存在空格,如果只用一个previous_sibling,找到的标签是空格
页:
[1]