一只魈咸鱼 发表于 2021-8-12 13:27:46

爬取百度小说时捕获的ajax预览为乱码

在除了这个请求外的所有xhr请求中很明显都没有小说内容:

这个请求的code200后面写着硬盘缓存,这个有什么特别的吗?文章内容藏哪了呢?
网页地址:
https://boxnovel.baidu.com/boxnovel/content?gid=4306063500&data=%7B%22fromaction%22%3A%22dushu%22%7D&cid=11348571

路神 发表于 2021-8-12 14:23:05

想要文本还要解密才行

一只魈咸鱼 发表于 2021-8-12 15:08:43

路神 发表于 2021-8-12 14:23
想要文本还要解密才行

方便说一下具体怎么做嘛

z5560636 发表于 2021-8-12 15:12:07

用selenium呗。

南归 发表于 2021-8-12 15:47:01

真想弄的话慢慢扣js吧

路神 发表于 2021-8-12 16:52:26

一只魈咸鱼 发表于 2021-8-12 15:08
方便说一下具体怎么做嘛

AES加密,密钥:D0CD8B760CE07BC3,偏移:2011121211143000,CBC模式

一只魈咸鱼 发表于 2021-8-29 17:56:46

请问他是如何从源代码转化为要解密的字符串的呢,这个源代码utf-8,gbk都解不了

rongma 发表于 2022-2-28 15:59:57

一只魈咸鱼 发表于 2021-8-29 17:56
请问他是如何从源代码转化为要解密的字符串的呢,这个源代码utf-8,gbk都解不了

解决了吗?

一只魈咸鱼 发表于 2022-3-3 13:09:13

要会JS逆向和解密,这个我暂时已经放弃了
页: [1]
查看完整版本: 爬取百度小说时捕获的ajax预览为乱码