鱼C论坛

 找回密码
 立即注册
查看: 1651|回复: 4

[技术交流] [Python]新手爬虫

[复制链接]
发表于 2020-3-22 12:10:31 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
我现在正在学习爬虫,就是有道词典那个爬虫,但是因为有道加了反爬虫的js东西,我现在在学这个,但是我一看发现这个东西需要的太多了md5加密,时间戳,这些东西我都要学习,我还是应该跨过学下一个呢?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-3-22 12:15:29 | 显示全部楼层
最好都学一下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-22 13:09:35 | 显示全部楼层
一起学
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-22 13:19:07 | 显示全部楼层
如果你对爬虫有兴趣的话 其实有道翻译这个 就是一个非常典型的签名反爬 关于时间戳 那是最简单的东西 用time库直接就可以拿出来用  md5直接用hashlib库

我是不建议你跳过的 因为现在网站基本都是加密的 各种反爬 如低级的user-agent反爬 到后面的文本混淆 JS渲染 验证码等 这都是做爬虫要面对的

而且有道翻译 难的不是在于加密 而是你要懂得找到加密的参数是什么 比如你知道了他是md5加密的 这只是第一步  你还得知道这个md5加密了什么东西
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-3-22 13:39:45 From FishC Mobile | 显示全部楼层
本帖最后由 Pythonnewers 于 2020-3-22 13:41 编辑
admintest166 发表于 2020-3-22 13:19
如果你对爬虫有兴趣的话 其实有道翻译这个 就是一个非常典型的签名反爬 关于时间戳 那是最简单的东西 用tim ...


嘿嘿,md5那个我搞出来了ヾ(▽)ノ
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-25 07:15

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表