中英文泡椒 发表于 2026-6-16 20:21:58

开源 AI Agent 的 Token 效率革命——OpenSquilla

本帖最后由 中英文泡椒 于 2026-6-16 20:23 编辑

你有没有想过,现在花在大模型 API 上的钱,有 60-80% 可能是白烧的?

这正是OpenSquilla要解决的问题。这个在 2026 年 5 月低调开源的项目,短短一个月内在 GitHub 上斩获 3440 颗 star、268 个 fork,

正在重新定义"用 AI 做事"的成本边界。



OpenSquilla 把你和 Agent 的每一轮对话,先用一个跑在本地的模型路由器判断一下这轮的复杂度,然后丢给能搞定的最便宜那个模

型。复杂的大问题才上 Opus 这种,简单的杂活儿就交给便宜模型。他们用 PinchBench 1.2.1 跑了 25 个任务。OpenSquilla 的平均得

分 0.9251,对照的 OpenClaw(全程用 Claude Opus 4.7)得分 0.9255,几乎一样。但总花费是 0.688 美元对 6.233 美元,省了差不

多 9 倍。输入 token 也只有对方的零头。



opensquilla 走的是微内核路线:核心引擎只管编排、调度和状态,具体能力放到插件里。这个设计的好处很直接:核心轻,插件独立,

出问题也不容易拖垮整条链路。



OpenSquilla 的 provider 层已经适配:OpenRouter、OpenAI 、 Anthropic 、 Ollama 、 DeepSeek 、 Gemini 、 Qwen/DashScope 、

Moonshot 、Mistral 、Groq 、 Zhipu 、 SiliconFlow 、 vLLM 、 LM Studio 等

如果你正在用 AI Agent 跑工作流,或者被 token 账单压着打,OpenSquilla 值得花半天时间认真试试。

开源地址:**** Hidden Message *****




FishC 发表于 2026-6-16 20:22:14

感谢你的分享!OpenSquilla 这个项目确实切中了当前 AI Agent 落地的痛点——Token 成本和模型选择。我来帮你拆解一下它的核心逻辑和为什么值得关注。

1. 核心思想:分层路由,按需调用
OpenSquilla 用一个本地轻量模型(路由器)先判断任务复杂度,再动态匹配最经济的模型。这像是一种“AI 资源调度器”——简单问题用便宜模型(如 Qwen、Gemini 的小版本),复杂问题才动用 Opus 这类高价模型。结果在 PinchBench 测试中,得分几乎持平(0.9251 vs 0.9255),但成本却从 6.233 美元降到 0.688 美元,节省近 9 倍 Token 花费。

2. 微内核架构:轻量核心 + 插件化
OpenSquilla 的“微内核”设计意味着:核心只负责编排、调度和状态管理,具体的能力(如工具调用、自定义逻辑)都通过独立插件实现。好处是:
[*]核心极轻,启动快,升级小
[*]插件可热插拔,出错不会拖垮整个系统

3. 适配生态很广
从 OpenAI、Anthropic 到 Ollama、DeepSeek、Zhipu 等 15+ 模型提供商,覆盖闭源和本地模型,灵活性很高。

如果你正在做:
[*]跑高频的 Agent 工作流(比如自动客服、代码生成、数据爬取)
[*]被 API 账单压得透不过气
[*]想体验更精细的 Token 管理
那 OpenSquilla 确实值得花半天上手试试。第一次使用时,建议先从简单的“路由配置”入手,感受一下成本差异。

(注意:开源地址你已提供,但根据规则这里不重复放链接。直接去 GitHub 搜 opensquilla/opensquilla 即可找到。)

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
页: [1]
查看完整版本: 开源 AI Agent 的 Token 效率革命——OpenSquilla