不二如是 发表于 2026-3-6 18:00:00

谷歌「Gemini 3.1 Flash-Lite」深夜掀桌!每秒狂飙363 token/s!1/4价格+5倍的速度



最近,谷歌正式发布了新模型Gemini 3.1 Flash-Lite。

先看最直观的数据:

它的输出速度达到363 tokens/s,这个速度在当前同级模型里非常夸张。
在线学习:

https://www.bilibili.com/video/BV1VoPpz7ET5

作为对比,GPT-5 mini大约是71 tokens/s,Claude 4.5 Haiku约108 tokens/s,也就是说Flash-Lite在输出速度上几乎是GPT-5 mini的5倍、Claude的3倍以上。

与此同时,它的API价格也非常激进,输入价格为每百万token 0.25美元,输出1.5美元,而Claude 4.5 Haiku的输出价格约5美元,整体成本明显更低。

速度和价格之外,它的性能指标也不差。

在学术推理测试GPQA Diamond中,Gemini 3.1 Flash-Lite取得86.9%的成绩,这类测试主要考察接近博士级别的科学推理能力,成绩已经超过不少同级模型。

在多模态理解测试中,它也表现稳定,说明该模型并不是单纯依靠速度取胜,而是在推理能力和多模态任务上保持了较强水平。

对于需要高吞吐量任务的场景,比如内容生成、翻译、代码分析或大规模数据处理,这种性能与成本的组合非常有吸引力。

更值得注意的是,Flash-Lite引入了可调推理深度的设计。

开发者可以根据任务复杂度自由选择“浅思考”或“深推理”。

简单分类或批处理任务可以走快速路径,把延迟和成本压到最低;

而多步骤推理、复杂分析则可以开启更深层计算,让效果接近更大的模型。

这其实反映出AI行业竞争逻辑的变化:

过去两年,各家都在比谁的模型更聪明、谁在榜单上跑分更高;
但Flash-Lite把重点转向真实产品场景里的两个核心指标——速度和成本。

当AI开始规模化落地时,性价比往往比极限跑分更重要,而谷歌显然正在这条赛道上提前布局。

评论区聊聊你的想法吧{:10_330:}

https://xxx.ilovefishc.com/forum/202505/12/120451wiv7viv5iebupbbr.png

>>万能兑换C币许愿池<<

如果有收获,别忘了评分{:10_281:} :

https://xxx.ilovefishc.com/forum/202011/20/092334ggd6inlzfisfrdir.png.thumb.jpg
https://xxx.ilovefishc.com/forum/202505/21/111710rvxgdn90vaub5gag.gif                                                                  

不二如是 发表于 2026-3-6 18:14:20

感谢分享 朕又在鱼C学到东西啦!非常满意{:10_275:}

第_个鱼油 发表于 2026-3-6 20:49:48

感谢分享 朕又在鱼C学到东西啦!非常满意{:10_275:}

lscp 发表于 2026-3-6 22:50:32

感谢分享 朕又在鱼C学到东西啦!非常满意{:10_275:}

不二如是 发表于 2026-3-7 10:38:33

感谢分享 朕又在鱼C学到东西啦!非常满意{:10_275:}

不二如是 发表于 2026-3-7 10:39:03

感谢分享 朕又在鱼C学到东西啦!非常满意{:10_275:}

不二如是 发表于 2026-3-7 10:39:33

感谢分享 朕又在鱼C学到东西啦!非常满意{:10_275:}
页: [1]
查看完整版本: 谷歌「Gemini 3.1 Flash-Lite」深夜掀桌!每秒狂飙363 token/s!1/4价格+5倍的速度