鱼C论坛

 找回密码
 立即注册
查看: 1727|回复: 5

[已解决]请问这种网站数据应该怎么抓取?

[复制链接]
发表于 2021-12-8 11:38:59 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
目标:https://gzclass.gztv.com/gksubjecpc/index.html
年级、课例那些通过爬虫都爬不出来
最佳答案
2021-12-8 12:31:28
wiselin 发表于 2021-12-8 12:28
对,就是这些基本信息,请问这2个url是怎么提取出来的?


爬虫第一部
确认所需要的信息是否存在网页源码里面,明显你这个没有在。那么肯定是通过其他方式加载的
抓包,多练

1.png

2.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-12-8 11:53:06 | 显示全部楼层
本帖最后由 Stubborn 于 2021-12-8 12:19 编辑

赤裸裸的数据在哪里呀,视频吗?

URL1 = https://gzclass.gztv.com/hcEdu/pc/getGradeData?topColumnId=1029


URL2 = https://gzclass.gztv.com/hcEdu/pc/getLessons?courseId=3a616f2f5345ac43c9f0a303a0792528

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-12-8 12:28:13 | 显示全部楼层
Stubborn 发表于 2021-12-8 11:53
赤裸裸的数据在哪里呀,视频吗?

对,就是这些基本信息,请问这2个url是怎么提取出来的?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-12-8 12:31:28 | 显示全部楼层    本楼为最佳答案   
wiselin 发表于 2021-12-8 12:28
对,就是这些基本信息,请问这2个url是怎么提取出来的?


爬虫第一部
确认所需要的信息是否存在网页源码里面,明显你这个没有在。那么肯定是通过其他方式加载的
抓包,多练

1.png

2.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-12-8 12:37:13 | 显示全部楼层
Stubborn 发表于 2021-12-8 12:31
爬虫第一部
确认所需要的信息是否存在网页源码里面,明显你这个没有在。那么肯定是通过其他方式加载的 ...

搞懂了,我实在太小白了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-12-8 12:43:47 | 显示全部楼层
wiselin 发表于 2021-12-8 12:37
搞懂了,我实在太小白了

难搞的是参数加密,要去抠js代码,搞人心态的验证码,慢慢都会遇到的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-12 17:31

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表