鱼C论坛

 找回密码
 立即注册
查看: 244|回复: 5

python爬虫逆向

[复制链接]
发表于 2026-2-17 23:24:50 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
现在学python遇到问题,现在学完了爬虫基本库requests,scrapy什么的,一部分网站没加密都是可以爬到的,有些有加密使用playwright也是可以抓的,但有些有加密和检测人机使用playwright过不了,所以需要学习逆向,想问一下应该从哪里开始学习逆向,应该看什么视频或者书籍
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2026-2-17 23:25:25 | 显示全部楼层
首先,理解你的问题:学完基本爬虫库后,遇到加密和反爬虫机制时,需要学习逆向工程来破解。逆向主要涉及分析JavaScript代码、加密算法和网络请求。

学习逆向可以从以下几个方面开始:

  • 基础知识:
      - 学习JavaScript基础,因为很多网站加密在客户端用JS实现。
      - 了解常见加密算法,如AES、RSA、Base64等,以及哈希函数如MD5、SHA。
      - 掌握HTTP协议和网络请求分析,使用浏览器开发者工具(按F12)查看网络请求和响应。
  • 工具使用:
      - 浏览器开发者工具:用于分析网络请求、调试JavaScript代码(Sources面板)。
      - 抓包工具:如Fiddler或Charles,捕获HTTP/HTTPS请求,帮助分析数据流。
      - Python库:如PyExecJSjs2py,用于在Python中执行JavaScript代码;requests模拟请求时处理加密参数。
  • 学习资源:
      - 视频:可以在视频平台搜索“JavaScript逆向”、“爬虫逆向工程”等关键词,观看相关教程系列,注意选择更新较新的内容。
      - 书籍:推荐《Python网络数据采集》(Web Scraping with Python),但更侧重基础;对于逆向,可以关注《Web黑客攻防》或在线技术博客的案例分析。
      - 实践:多参考技术论坛中的逆向案例分享,但注意不要直接复制代码,要理解原理。
  • 实践步骤:
      - 从简单网站开始,尝试分析其登录或数据请求的加密参数。
      - 使用开发者工具定位加密函数,通过调试找出关键代码。
      - 在Python中重现加密逻辑,或调用JS代码生成参数。


关键操作示例:
1. 打开浏览器开发者工具,切换到Network面板,找到加密请求。
2. 在Sources面板搜索加密关键词(如encrypt、sign),断点调试JS代码。
3. 将JS加密函数提取到Python中,使用execjs执行。

代码示例:

  1. import requests
  2. import execjs

  3. # 读取JavaScript加密代码
  4. with open('encrypt.js', 'r', encoding='utf-8') as f:
  5.     js_code = f.read()

  6. # 编译JS代码
  7. ctx = execjs.compile(js_code)

  8. # 调用加密函数
  9. data_to_encrypt = "example"
  10. encrypted_param = ctx.call("encryptFunction", data_to_encrypt)

  11. # 发送请求
  12. url = "目标网址"
  13. headers = {"User-Agent": "自定义"}
  14. response = requests.post(url, data={"param": encrypted_param}, headers=headers)
  15. print(response.text)
复制代码


注意事项:
- 逆向可能涉及法律风险,请确保仅用于学习和合法用途。
- 从易到难练习,逐步积累经验。

希望这些建议能帮你入门逆向工程!坚持下去,你会越来越熟练。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2026-2-18 08:24:57 | 显示全部楼层
不太方便说,逆向不建议自学
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2026-2-18 11:02:12 | 显示全部楼层
JavaScript基础加密算法如AES、RSA、Base64哈希函数如MD5、SHA浏览器开发者工具
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2026-2-27 12:56:45 | 显示全部楼层
推荐书籍:《JavaScript 高级程序设计(第 4 版)》(红宝书),只看核心概念部分,不用全背。
推荐视频:B 站搜索"JavaScript 教程”,找播放量高的基础课快速过一遍
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-3-13 00:06

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表