wzdyjn 发表于 2020-5-17 11:19:32

爬虫问题


https://sourl.cn/c2EvQC   这个pdf的爬取找了好久都没有找到地址 ,,,郁闷 哪位大仙帮下我 下

老八秘制 发表于 2020-5-17 11:21:13

猜 谜 游 戏

liuzhengyuan 发表于 2020-5-17 11:24:26

老八秘制 发表于 2020-5-17 11:21
猜 谜 游 戏

应该是 反爬虫的

xiaosi4081 发表于 2020-5-17 12:11:22

点你那个链接进去自动跳转到了:
https://www.kdocs.cn/l/supWoGKrT?f=111

xiaosi4081 发表于 2020-5-17 12:16:29

他那个应该是靠js来绘制canvas画布的吧{:10_256:}

悠悠2264 发表于 2020-5-17 12:36:25

他存储起来的不是pdf,是一张张图片。
比如:https://ks3-cn-beijing.ksyun.com/weboffice/vectorpdf/bf32b0242fa67d1b32ec5b25a0694233/1/035ab4a24a3651793e93984af717aa38/doc/I/2?Expires=1589689829&KSSAccessKeyId=AKLT8UsQHPqzQva5fTr3vvnN1g&Signature=SpEOBodbPNZdS75VqRH9H1LapVo%3D
下载后把后缀改成png即可查看图片。
但每次请求都有个签名,这就不好办了{:10_266:}

wzdyjn 发表于 2020-5-17 13:34:21

我用wps的云文档下载了,,,晕

Twilight6 发表于 2020-5-17 14:44:51

wzdyjn 发表于 2020-5-17 13:34
我用wps的云文档下载了,,,晕

哈哈哈真的现实啊{:10_285:}
页: [1]
查看完整版本: 爬虫问题