鱼C论坛

 找回密码
 立即注册
查看: 11473|回复: 4

如何用爬虫将百度云的资源保存到自己的网盘?

[复制链接]
发表于 2016-1-21 11:29:42 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
正在看小甲鱼的教学视频,大爱!!
心血来潮想写个爬虫把还没看的下载下来(一个一个下载好麻烦的哈。。)

已经爬取小甲鱼视频的百度云盘链接和密码(还费了好大劲,汗。。),
例如:'http://pan.baidu.com/s/1dDrkbfz' , ,,'1fd7',,,

求问:接下来如何将资源保存到自己的网盘啊?

ps:刚开始学python,完全零基础,请大神们多多包涵哈^_^

本帖被以下淘专辑推荐:

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-1-21 13:40:42 | 显示全部楼层
我就说下大致思路

使用urllib.request里面的opener来创建一个能存储cookie的opener(http.cookiejar)

配合浏览器的开发者工具找填写提取码时的关键post,我这边稍微看了下post的数据也不复杂,没有添加一些时间戳之类的干扰数据,只有pwd(提取码)和vcode(验证码)

post成功之后刷新这个页面就会出现保存到网盘和下载的链接了,是通过js的ajax来实现的,稍微耐心点看看js代码吧
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 3 反对 0

使用道具 举报

 楼主| 发表于 2016-1-21 20:43:52 | 显示全部楼层
hldh214 发表于 2016-1-21 13:40
我就说下大致思路

使用urllib.request里面的opener来创建一个能存储cookie的opener(http.cookiejar)

非常感谢!!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-8-15 15:18:27 | 显示全部楼层
不觉明历啊。。。。。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-9-8 16:02:38 | 显示全部楼层
hldh214 发表于 2016-1-21 13:40
我就说下大致思路

使用urllib.request里面的opener来创建一个能存储cookie的opener(http.cookiejar)

分析的灰常到位!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-23 08:37

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表