Pythonnewers 发表于 2020-3-22 12:10:31

[Python]新手爬虫

我现在正在学习爬虫,就是有道词典那个爬虫,但是因为有道加了反爬虫的js东西,我现在在学这个,但是我一看发现这个东西需要的太多了md5加密,时间戳,这些东西我都要学习,我还是应该跨过学下一个呢?

栗子钾 发表于 2020-3-22 12:15:29

最好都学一下

一个账号 发表于 2020-3-22 13:09:35

一起学

admintest166 发表于 2020-3-22 13:19:07

如果你对爬虫有兴趣的话 其实有道翻译这个 就是一个非常典型的签名反爬 关于时间戳 那是最简单的东西 用time库直接就可以拿出来用md5直接用hashlib库

我是不建议你跳过的 因为现在网站基本都是加密的 各种反爬 如低级的user-agent反爬 到后面的文本混淆 JS渲染 验证码等 这都是做爬虫要面对的

而且有道翻译 难的不是在于加密 而是你要懂得找到加密的参数是什么 比如你知道了他是md5加密的 这只是第一步你还得知道这个md5加密了什么东西 {:10_266:}

Pythonnewers 发表于 2020-3-22 13:39:45

本帖最后由 Pythonnewers 于 2020-3-22 13:41 编辑

admintest166 发表于 2020-3-22 13:19
如果你对爬虫有兴趣的话 其实有道翻译这个 就是一个非常典型的签名反爬 关于时间戳 那是最简单的东西 用tim ...

嘿嘿,md5那个我搞出来了ヾ(▽)ノ
页: [1]
查看完整版本: [Python]新手爬虫