鱼C论坛

 找回密码
 立即注册
查看: 491|回复: 1

[已解决]爬取豌豆夹网站遇到的问题

[复制链接]
发表于 2018-11-28 14:37:34 | 显示全部楼层 |阅读模式
3鱼币
经过分析网站得出url为:
https://www.wandoujia.com/wdjweb/api/top/more?resourceType=1&page=1
https://www.wandoujia.com/wdjweb/api/top/more?resourceType=1&page=2
https://www.wandoujia.com/wdjweb/api/top/more?resourceType=1&page=3
https://www.wandoujia.com/wdjweb/api/top/more?resourceType=1&page=4

打开网页返回为







问:返回值的是否是json数据? 如何获取里面的数据?
最佳答案
2018-11-28 14:37:35
json数据,在data中的content键名中,
这种网页源代码的话,可以先把json转成字典,再用re、bs4、pq等解析方法解析就行了
json.jpg

最佳答案

查看完整内容

json数据,在data中的content键名中, 这种网页源代码的话,可以先把json转成字典,再用re、bs4、pq等解析方法解析就行了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-11-28 14:37:35 | 显示全部楼层    本楼为最佳答案   
json数据,在data中的content键名中,
这种网页源代码的话,可以先把json转成字典,再用re、bs4、pq等解析方法解析就行了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-17 12:19

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表