谷歌「Gemini 3.1 Flash-Lite」深夜掀桌！每秒狂飙363 token/s！1/4价格+5倍的速度

不二如是 · 发表于 2026-3-6 18:00:00

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

5c87d90a34a34bcdcc5428dbd7194750c3fe7529.jpg@308w_174h.jpeg

最近，谷歌正式发布了新模型Gemini 3.1 Flash-Lite。

先看最直观的数据：

它的输出速度达到363 tokens/s，这个速度在当前同级模型里非常夸张。

在线学习：

作为对比，GPT-5 mini大约是71 tokens/s，Claude 4.5 Haiku约108 tokens/s，也就是说Flash-Lite在输出速度上几乎是GPT-5 mini的5倍、Claude的3倍以上。

与此同时，它的API价格也非常激进，输入价格为每百万token 0.25美元，输出1.5美元，而Claude 4.5 Haiku的输出价格约5美元，整体成本明显更低。

速度和价格之外，它的性能指标也不差。

在学术推理测试GPQA Diamond中，Gemini 3.1 Flash-Lite取得86.9%的成绩，这类测试主要考察接近博士级别的科学推理能力，成绩已经超过不少同级模型。

在多模态理解测试中，它也表现稳定，说明该模型并不是单纯依靠速度取胜，而是在推理能力和多模态任务上保持了较强水平。

对于需要高吞吐量任务的场景，比如内容生成、翻译、代码分析或大规模数据处理，这种性能与成本的组合非常有吸引力。

更值得注意的是，Flash-Lite引入了可调推理深度的设计。

开发者可以根据任务复杂度自由选择“浅思考”或“深推理”。

简单分类或批处理任务可以走快速路径，把延迟和成本压到最低；

而多步骤推理、复杂分析则可以开启更深层计算，让效果接近更大的模型。

这其实反映出AI行业竞争逻辑的变化：

过去两年，各家都在比谁的模型更聪明、谁在榜单上跑分更高；

但Flash-Lite把重点转向真实产品场景里的两个核心指标——速度和成本。

当AI开始规模化落地时，性价比往往比极限跑分更重要，而谷歌显然正在这条赛道上提前布局。

评论区聊聊你的想法吧

登录/注册后可看大图

>>万能兑换C币许愿池<<

如果有收获，别忘了评分

：

登录/注册后可看大图

不二如是 · 发表于 2026-3-6 18:14:20

感谢分享朕又在鱼C学到东西啦！非常满意

第_个鱼油 · 发表于 2026-3-6 20:49:48

感谢分享朕又在鱼C学到东西啦！非常满意

lscp · 发表于 2026-3-6 22:50:32

感谢分享朕又在鱼C学到东西啦！非常满意

不二如是 · 发表于 2026-3-7 10:38:33

感谢分享朕又在鱼C学到东西啦！非常满意

不二如是 · 发表于 2026-3-7 10:39:03

感谢分享朕又在鱼C学到东西啦！非常满意

不二如是 · 发表于 2026-3-7 10:39:33

感谢分享朕又在鱼C学到东西啦！非常满意

账号		自动登录	找回密码
密码			立即注册

[最新资讯] 谷歌「Gemini 3.1 Flash-Lite」深夜掀桌！每秒狂飙363 token/s！1/4价格+5倍的速度

马上注册，结交更多好友，享用更多功能^_^

评分

相关帖子

浏览过的版块