2892150342ABC 发表于 2020-8-19 21:56:41

怎么爬取喜马拉雅付费专辑音频

        各位大哥,我跪求怎么爬取喜马拉雅付费专辑音频,我有vip,求过程!(过程尽量易懂,我是入门小白)

Twilight6 发表于 2020-8-19 22:00:03



看看这个有没有帮助:

https://www.jianshu.com/p/88c33c8fddc1

用 VIP 的应该带上 cookie 就行吧,我也不太清楚

2892150342ABC 发表于 2020-8-19 22:01:04

我一开始看这个https://fishc.com.cn/forum.php?mod=viewthread&tid=167788&highlight=%CF%B2%C2%ED%C0%AD%D1%C5,看的我懵,看看您发的吧

2892150342ABC 发表于 2020-8-19 22:02:36

一样懵……
对不起大哥,能麻烦您写一下过程吗,我是小白……

Twilight6 发表于 2020-8-19 22:04:12

2892150342ABC 发表于 2020-8-19 22:02
一样懵……
对不起大哥,能麻烦您写一下过程吗,我是小白……



我没爬过这些,所以不怎么会哈

你自己按照教程来吧~,VIP 也可以看看这个文章:https://www.jianshu.com/p/39b90a6d6b06

2892150342ABC 发表于 2020-8-19 22:09:16

Twilight6 发表于 2020-8-19 22:04
我没爬过这些,所以不怎么会哈

你自己按照教程来吧~,VIP 也可以看看这个文章:https://www.jians ...

我看看能用上不

luxiaolan6373 发表于 2020-8-20 17:54:20

方法1:
第一步:手动登陆一下你的vip账号
第二步:浏览器上按F12打开调试器,然后获取cookie,你随便看一个cookie,复制出来,这个怎么看cookie你可以百度一下,很容易理解的.
第三步:上代码.
headers = {"user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36",
               "cookie":"这里填上你的cookie即可",
               }
res=requests.get(url,headers=headers)
print(res.text)
以上代码填好后测试,有源码返回则说明成功!不行就把其它的协议要求的东西全填上
第四步:编写数据整理的代码..这个就是字符串或者字典的切片提取问题了,简单的很.不过多啰嗦 用bs4或者json模块
方法二:
方法二和上面基本一样,就是多个登陆的过程,,模拟登陆过程..模拟登陆过程的话,就比较复杂,需要对接验证码平台,然后分析点击登陆后的提交 数据格式.

Chysial 发表于 2020-8-20 17:59:24

首先,你要有个vip账号
页: [1]
查看完整版本: 怎么爬取喜马拉雅付费专辑音频