|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
在观看爬取豆瓣top250视频之后,练习爬取大众点评网站数据。
这段代码:
- #找出一共多少页
- def find_depth(res):
- soup = bs4.BeautifulSoup(res.text,'html.parser')
- depth = soup.find('span',class_ = 'PageMore').previous_sibling.previous_sibling.text
- return int(depth)
- def main():
- host = 'http://www.dianping.com/tianjin/ch10/g110o3'
- res = open_url(host)
- depth = find_depth(res)
复制代码
提示报错为:AttributeError: 'NoneType' object has no attribute 'previous_sibling'。
不知道为辽什莫,请大神指点哇
你看错地方了,你找 span标签干什么??
- <div class="page">
- <a href="http://www.dianping.com/tianjin/ch10/g110o3p48" data-ga-page="48" class="prev" title="上一页">上一页</a>
- <a href="http://www.dianping.com/tianjin/ch10/g110o3" data-ga-page="1" class="PageLink" title="1">1</a>
- <span class="PageMore">...</span>
- <a href="http://www.dianping.com/tianjin/ch10/g110o3p45" data-ga-page="45" class="PageLink" title="45">45</a>
- <a href="http://www.dianping.com/tianjin/ch10/g110o3p46" data-ga-page="46" class="PageLink" title="46">46</a>
- <a href="http://www.dianping.com/tianjin/ch10/g110o3p47" data-ga-page="47" class="PageLink" title="47">47</a>
- <a href="http://www.dianping.com/tianjin/ch10/g110o3p48" data-ga-page="48" class="PageLink" title="48">48</a>
- <a class="cur">49</a>
- <a href="http://www.dianping.com/tianjin/ch10/g110o3p50" data-ga-page="50" class="PageLink" title="50">50</a>
- <a href="http://www.dianping.com/tianjin/ch10/g110o3p50" data-ga-page="50" class="next" title="下一页">下一页</a>
- </div>
复制代码
你要找的是
class=page里面的class= PageLink的a标签的最后一个。
|
|