今天的我更强了 发表于 2020-7-3 14:35:03

爬虫问题(为什么总是被删帖啊)

关于网易云爬取评论,小甲鱼老师视频中的用到的网址带有数字,数字就是歌曲代名词,但我爬取的时候是https://music.163.com/weapi/comment/resource/comments/get?csrf_token=
get那个地方应该是数字 ,可是这里是get,我就不能任意爬取歌曲评论了,应该怎么办?

qiuyouzhi 发表于 2020-7-3 14:35:47

抓包看看里面有没有csrf_token呗

今天的我更强了 发表于 2020-7-3 14:48:56

qiuyouzhi 发表于 2020-7-3 14:35
抓包看看里面有没有csrf_token呗

什么意思..没找到这样单独一个包,但很多都带有这个的后缀

qiuyouzhi 发表于 2020-7-3 14:50:04

今天的我更强了 发表于 2020-7-3 14:48
什么意思..没找到这样单独一个包,但很多都带有这个的后缀

你的意思是不是
csrf_token=
等号后面应该有个数字?

今天的我更强了 发表于 2020-7-3 14:59:06

qiuyouzhi 发表于 2020-7-3 14:50
你的意思是不是
csrf_token=
等号后面应该有个数字?

不是的,小甲鱼爬取时候的网址为https://music.163.com/weapi/v1/resource/comments/R_SO_4_25251545?csrf_token=
数字是我乱打的,但不同的数字能够代表不同的歌曲,而我爬取的时候只有get字母

comeheres 发表于 2020-7-3 17:22:37

今天的我更强了 发表于 2020-7-3 14:59
不是的,小甲鱼爬取时候的网址为https://music.163.com/weapi/v1/resource/comments/R_SO_4_25251545?csr ...

网站更新了而已,现在歌曲ID在POST提交的params参数里
总共需要提交2个参数,params是AES加密,encSecKey是RSA加密,具体加密分析可用搜索查询

另外给你一个无加密,直接可Get获取的api
http://music.163.com/api/v1/resource/comments/R_SO_4_1426649237?offset=0&limit=10

今天的我更强了 发表于 2020-7-3 20:53:14

comeheres 发表于 2020-7-3 17:22
网站更新了而已,现在歌曲ID在POST提交的params参数里
总共需要提交2个参数,params是AES加密,encSecKe ...

谢谢
页: [1]
查看完整版本: 爬虫问题(为什么总是被删帖啊)