豆瓣爬取250中的查找页面数看不懂,求教
# 找出一共有多少个页面def find_depth(res):
soup = bs4.BeautifulSoup(res.text, 'html.parser')
depth = soup.find('span', class_='next').previous_sibling.previous_sibling.text
return int(depth)
我想知道'span', class_='next'这个是怎么确定的?,确定这个页面数的目的是什么?谢谢大家!
审核元素找到的:
确定页面数是为了能将所有页面都爬取下来呀
页码数知道了你也就直接可以设置爬取的次数什么的了,只要更改url 部分的字符即可 仔细翻看页面源码 右键(右键你所需要的查找的内容不够)——检查——然后就能确定你需要的标签了 Twilight6 发表于 2020-6-21 13:53
审核元素找到的:
谢谢! wp231957 发表于 2020-6-21 13:54
仔细翻看页面源码
谢谢!
lanshj 发表于 2020-6-21 16:28
右键(右键你所需要的查找的内容不够)——检查——然后就能确定你需要的标签了
谢谢
页:
[1]