鱼C论坛

 找回密码
 立即注册
查看: 711|回复: 8

[已解决]未解决(爬虫方面的)

[复制链接]
发表于 2020-4-7 16:04:47 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
在查找一共多少个页面的时候,发现没有兄弟节,不能用previous_sibling,这时候该怎么办
最佳答案
2020-4-7 20:26:20
lastpage = soup.find(name='a', attrs={'class':['pbutton', 'asciifont']}, text=re.compile('尾页'))
print(lastpage.attrs['href'].split('=')[-1])
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-4-7 16:10:39 | 显示全部楼层
页面上方不会有page嘛?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-4-7 16:16:29 | 显示全部楼层
qiuyouzhi 发表于 2020-4-7 16:10
页面上方不会有page嘛?

enm。。。有page
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-4-7 16:18:23 From FishC Mobile | 显示全部楼层
要拿具体网站说话
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-4-7 16:18:36 | 显示全部楼层

那就按那个page来呗?
后面有个数,写个for循环:
for i in range(20):
    url = "url"
然后你把url里面的page对应的值改成i就好了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-4-7 17:07:20 | 显示全部楼层

哪个网站?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-4-7 17:49:23 | 显示全部楼层
希望可以贴出相关代码,和相应的网站。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-4-7 18:17:24 | 显示全部楼层
上代码,上url。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-4-7 20:26:20 | 显示全部楼层    本楼为最佳答案   
lastpage = soup.find(name='a', attrs={'class':['pbutton', 'asciifont']}, text=re.compile('尾页'))
print(lastpage.attrs['href'].split('=')[-1])
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-26 04:53

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表