柿子饼同学 发表于 2021-2-27 15:52:01

今天爬了网抑云阴乐的评论(*^_^*)

参考帖子:爬取网易云音乐的精彩评论
https://fishc.com.cn/thread-100435-1-1.html
(出处: 鱼C论坛)
下面就是照做,成功找到包含评论的文件
然后就是这样>>> params = 'yeYEazqIGnhm1OART+JrHNBL8V5F0OEczWUHtohY1KuKL+GEQs+3cQYwOhC1eb07gPvwUYx1WKMsgw/mPiY06lHIXNK+Gpi129ByZlMWSTSRE4fCgi5pRPoczWYFYXvzO4zwxEAIgxH7snnANfAAZ07IsnC+8Atl7d1sGFIP42f+79l7k9Ht0EMQ2blyw+fP'
>>> encSecKey = '45dfffc6309b3a201cb664a5ea44964b7e9304f4cf62ade24f2accada845335f606ad9d8cfa8c968cbeb6d032de176012e9c9aef61313e117c0a2124f56005836a41a144bda145c860af8f73cffb2322e45e9c6389852ce77b1677f9cad8bde01136003ae2a57817bf952693fcb3dcb85f87d6ac314b6e6071f2455f90f6e546'
>>> data = {
      "params": params,
      "encSecKey": encSecKey
      }
>>> nameid = 4466775
然后
target_url = "http://music.163.com/weapi/v1/resource/comments/R_SO_4_{}?csrf_token=".format(nameid)
下面开始爬
import requests as r
>>> headers={"User-Agent":
      "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:85.0) Gecko/20100101 Firefox/85.0"}
>>> res = r.post(target_url, headers=headers, data=data)

>>> f = open('resp.txt', 'w', encoding='utf-8')
>>> f.write(res.text)
17640
>>> f.close()
后面就导入jsonimport json
>>> comments_json = json.loads(res.text)
>>> comments_json
然后找到对应的键
comments_json['hotComments']
然后就好了,最让我吃惊的是一路上竟然没报错{:10_256:}
这是我发的第0个帖子

柿子饼同学 发表于 2021-2-27 17:33:58

学习日记0

yuedong 发表于 2021-3-5 22:55:02

{:5_101:}

抖音 发表于 2021-3-6 06:07:38

看看

永恒的蓝色梦想 发表于 2021-3-6 10:50:15

牛蛙

柿子饼同学 发表于 2021-3-6 11:29:00

谢谢谢谢{:10_254:}

哈哈哈哈哈xiao 发表于 2021-3-6 15:26:47

66
页: [1]
查看完整版本: 今天爬了网抑云阴乐的评论(*^_^*)