开源 AI Agent 的 Token 效率革命——OpenSquilla,科技·AI·新纪元,前沿与探索,鱼C论坛

中英文泡椒 发表于 2026-6-16 20:21:58

开源 AI Agent 的 Token 效率革命——OpenSquilla

本帖最后由中英文泡椒于 2026-6-16 20:23 编辑

你有没有想过，现在花在大模型 API 上的钱，有 60-80% 可能是白烧的？

这正是OpenSquilla要解决的问题。这个在 2026 年 5 月低调开源的项目，短短一个月内在 GitHub 上斩获 3440 颗 star、268 个 fork，

正在重新定义"用 AI 做事"的成本边界。

OpenSquilla 把你和 Agent 的每一轮对话，先用一个跑在本地的模型路由器判断一下这轮的复杂度，然后丢给能搞定的最便宜那个模

型。复杂的大问题才上 Opus 这种，简单的杂活儿就交给便宜模型。他们用 PinchBench 1.2.1 跑了 25 个任务。OpenSquilla 的平均得

分 0.9251，对照的 OpenClaw（全程用 Claude Opus 4.7）得分 0.9255，几乎一样。但总花费是 0.688 美元对 6.233 美元，省了差不

多 9 倍。输入 token 也只有对方的零头。

opensquilla 走的是微内核路线：核心引擎只管编排、调度和状态，具体能力放到插件里。这个设计的好处很直接：核心轻，插件独立，

出问题也不容易拖垮整条链路。

OpenSquilla 的 provider 层已经适配：OpenRouter、OpenAI 、 Anthropic 、 Ollama 、 DeepSeek 、 Gemini 、 Qwen/DashScope 、

Moonshot 、Mistral 、Groq 、 Zhipu 、 SiliconFlow 、 vLLM 、 LM Studio 等

如果你正在用 AI Agent 跑工作流，或者被 token 账单压着打，OpenSquilla 值得花半天时间认真试试。

开源地址：**** Hidden Message *****

FishC 发表于 2026-6-16 20:22:14

感谢你的分享！OpenSquilla 这个项目确实切中了当前 AI Agent 落地的痛点——Token 成本和模型选择。我来帮你拆解一下它的核心逻辑和为什么值得关注。

1. 核心思想：分层路由，按需调用
OpenSquilla 用一个本地轻量模型（路由器）先判断任务复杂度，再动态匹配最经济的模型。这像是一种“AI 资源调度器”——简单问题用便宜模型（如 Qwen、Gemini 的小版本），复杂问题才动用 Opus 这类高价模型。结果在 PinchBench 测试中，得分几乎持平（0.9251 vs 0.9255），但成本却从 6.233 美元降到 0.688 美元，节省近 9 倍 Token 花费。

2. 微内核架构：轻量核心 + 插件化
OpenSquilla 的“微内核”设计意味着：核心只负责编排、调度和状态管理，具体的能力（如工具调用、自定义逻辑）都通过独立插件实现。好处是：
[*]核心极轻，启动快，升级小
[*]插件可热插拔，出错不会拖垮整个系统

3. 适配生态很广
从 OpenAI、Anthropic 到 Ollama、DeepSeek、Zhipu 等 15+ 模型提供商，覆盖闭源和本地模型，灵活性很高。

如果你正在做：
[*]跑高频的 Agent 工作流（比如自动客服、代码生成、数据爬取）
[*]被 API 账单压得透不过气
[*]想体验更精细的 Token 管理
那 OpenSquilla 确实值得花半天上手试试。第一次使用时，建议先从简单的“路由配置”入手，感受一下成本差异。

（注意：开源地址你已提供，但根据规则这里不重复放链接。直接去 GitHub 搜 opensquilla/opensquilla 即可找到。）

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

页: [1]

鱼C论坛's Archiver

开源 AI Agent 的 Token 效率革命——OpenSquilla