谷歌「Gemini 3.1 Flash-Lite」深夜掀桌！每秒狂飙363 token/s！1/4价格+5倍的速度,科技·AI·新纪元,前沿与探索,鱼C论坛

不二如是 发表于 2026-3-6 18:00:00

谷歌「Gemini 3.1 Flash-Lite」深夜掀桌！每秒狂飙363 token/s！1/4价格+5倍的速度

最近，谷歌正式发布了新模型Gemini 3.1 Flash-Lite。

先看最直观的数据：

它的输出速度达到363 tokens/s，这个速度在当前同级模型里非常夸张。
在线学习：

https://www.bilibili.com/video/BV1VoPpz7ET5

作为对比，GPT-5 mini大约是71 tokens/s，Claude 4.5 Haiku约108 tokens/s，也就是说Flash-Lite在输出速度上几乎是GPT-5 mini的5倍、Claude的3倍以上。

与此同时，它的API价格也非常激进，输入价格为每百万token 0.25美元，输出1.5美元，而Claude 4.5 Haiku的输出价格约5美元，整体成本明显更低。

速度和价格之外，它的性能指标也不差。

在学术推理测试GPQA Diamond中，Gemini 3.1 Flash-Lite取得86.9%的成绩，这类测试主要考察接近博士级别的科学推理能力，成绩已经超过不少同级模型。

在多模态理解测试中，它也表现稳定，说明该模型并不是单纯依靠速度取胜，而是在推理能力和多模态任务上保持了较强水平。

对于需要高吞吐量任务的场景，比如内容生成、翻译、代码分析或大规模数据处理，这种性能与成本的组合非常有吸引力。

更值得注意的是，Flash-Lite引入了可调推理深度的设计。

开发者可以根据任务复杂度自由选择“浅思考”或“深推理”。

简单分类或批处理任务可以走快速路径，把延迟和成本压到最低；

而多步骤推理、复杂分析则可以开启更深层计算，让效果接近更大的模型。

这其实反映出AI行业竞争逻辑的变化：

过去两年，各家都在比谁的模型更聪明、谁在榜单上跑分更高；
但Flash-Lite把重点转向真实产品场景里的两个核心指标——速度和成本。

当AI开始规模化落地时，性价比往往比极限跑分更重要，而谷歌显然正在这条赛道上提前布局。

评论区聊聊你的想法吧{:10_330:}

https://xxx.ilovefishc.com/forum/202505/12/120451wiv7viv5iebupbbr.png

>>万能兑换C币许愿池<<

如果有收获，别忘了评分{:10_281:} ：

https://xxx.ilovefishc.com/forum/202011/20/092334ggd6inlzfisfrdir.png.thumb.jpg
https://xxx.ilovefishc.com/forum/202505/21/111710rvxgdn90vaub5gag.gif

不二如是 发表于 2026-3-6 18:14:20

感谢分享朕又在鱼C学到东西啦！非常满意{:10_275:}

第_个鱼油 发表于 2026-3-6 20:49:48

感谢分享朕又在鱼C学到东西啦！非常满意{:10_275:}

lscp 发表于 2026-3-6 22:50:32

感谢分享朕又在鱼C学到东西啦！非常满意{:10_275:}

不二如是 发表于 2026-3-7 10:38:33

感谢分享朕又在鱼C学到东西啦！非常满意{:10_275:}

不二如是 发表于 2026-3-7 10:39:03

感谢分享朕又在鱼C学到东西啦！非常满意{:10_275:}

不二如是 发表于 2026-3-7 10:39:33

感谢分享朕又在鱼C学到东西啦！非常满意{:10_275:}

页: [1]

鱼C论坛's Archiver

谷歌「Gemini 3.1 Flash-Lite」深夜掀桌！每秒狂飙363 token/s！1/4价格+5倍的速度