鱼C论坛

 找回密码
 立即注册
查看: 900|回复: 3

[已解决]爬取豌豆夹网站遇到的问题

[复制链接]
发表于 2018-11-28 14:41:36 | 显示全部楼层 |阅读模式
2鱼币
本帖最后由 小强工作室 于 2018-11-28 14:42 编辑

经过分析url地址为:
https://www.wandoujia.com/wdjweb/api/top/more?resourceType=1&page=1
https://www.wandoujia.com/wdjweb/api/top/more?resourceType=1&page=2
https://www.wandoujia.com/wdjweb/api/top/more?resourceType=1&page=3
https://www.wandoujia.com/wdjweb/api/top/more?resourceType=1&page=4

问:返回值是json数据吗?如何获取里面的数据?
最佳答案
2018-11-28 14:41:37
内容是json格式。
获取方法如下
import jsoon # 导入json模块
content = 下载的json文件
dict_file = json.load(content) # json转dict
# 已经把content 转为 字典了,下面要得到字典里面的内容,用字典的方法获取就可以了

最佳答案

查看完整内容

内容是json格式。 获取方法如下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-11-28 14:41:37 | 显示全部楼层    本楼为最佳答案   
内容是json格式。
获取方法如下
import jsoon # 导入json模块
content = 下载的json文件
dict_file = json.load(content) # json转dict
# 已经把content 转为 字典了,下面要得到字典里面的内容,用字典的方法获取就可以了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-11-28 14:52:27 | 显示全部楼层
是json,获取方法可以把json转成字典,逐一测试并获取。  
会用pandas用pandas处理。
不会的话,用字典就好了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-12-5 11:23:00 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-6-24 03:50

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表