鱼C论坛

 找回密码
 立即注册
查看: 1948|回复: 5

爬虫:从b站找编程最火的排序

[复制链接]
发表于 2022-4-30 21:07:48 | 显示全部楼层
浏览器看到的码源是浏览器经过html加载,css渲染和javascript处理之后的结果,和requests get的不一样是很正常的。
你怕的这个页面的数据,并没有直接放在html里,而是放在了后续的ajax加载过程。
Screenshot 2022-04-30 205423.jpg

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-5-1 00:40:45 | 显示全部楼层
Victor0321 发表于 2022-4-30 22:30
这样看是的 。。 我就照着你给我发的还找了一会 。。。    那就是意思是如果源码没有放在html里 我只能在 ...

直接在其他response搜不到这个url,估计这个url是根据javascript生成的,想找出生成URL的方法可能有点困难,估计得用javascript逆向相关的库,建议刚学爬虫先不研究逆向。
先找点别的简单的网页学习吧。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-10-27 10:15

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表