谷歌「Gemini 3.1 Flash-Lite」深夜掀桌!每秒狂飙363 token/s!1/4价格+5倍的速度
最近,谷歌正式发布了新模型Gemini 3.1 Flash-Lite。
先看最直观的数据:
它的输出速度达到363 tokens/s,这个速度在当前同级模型里非常夸张。
在线学习:
https://www.bilibili.com/video/BV1VoPpz7ET5
作为对比,GPT-5 mini大约是71 tokens/s,Claude 4.5 Haiku约108 tokens/s,也就是说Flash-Lite在输出速度上几乎是GPT-5 mini的5倍、Claude的3倍以上。
与此同时,它的API价格也非常激进,输入价格为每百万token 0.25美元,输出1.5美元,而Claude 4.5 Haiku的输出价格约5美元,整体成本明显更低。
速度和价格之外,它的性能指标也不差。
在学术推理测试GPQA Diamond中,Gemini 3.1 Flash-Lite取得86.9%的成绩,这类测试主要考察接近博士级别的科学推理能力,成绩已经超过不少同级模型。
在多模态理解测试中,它也表现稳定,说明该模型并不是单纯依靠速度取胜,而是在推理能力和多模态任务上保持了较强水平。
对于需要高吞吐量任务的场景,比如内容生成、翻译、代码分析或大规模数据处理,这种性能与成本的组合非常有吸引力。
更值得注意的是,Flash-Lite引入了可调推理深度的设计。
开发者可以根据任务复杂度自由选择“浅思考”或“深推理”。
简单分类或批处理任务可以走快速路径,把延迟和成本压到最低;
而多步骤推理、复杂分析则可以开启更深层计算,让效果接近更大的模型。
这其实反映出AI行业竞争逻辑的变化:
过去两年,各家都在比谁的模型更聪明、谁在榜单上跑分更高;
但Flash-Lite把重点转向真实产品场景里的两个核心指标——速度和成本。
当AI开始规模化落地时,性价比往往比极限跑分更重要,而谷歌显然正在这条赛道上提前布局。
评论区聊聊你的想法吧{:10_330:}
https://xxx.ilovefishc.com/forum/202505/12/120451wiv7viv5iebupbbr.png
>>万能兑换C币许愿池<<
如果有收获,别忘了评分{:10_281:} :
https://xxx.ilovefishc.com/forum/202011/20/092334ggd6inlzfisfrdir.png.thumb.jpg
https://xxx.ilovefishc.com/forum/202505/21/111710rvxgdn90vaub5gag.gif 感谢分享 朕又在鱼C学到东西啦!非常满意{:10_275:} 感谢分享 朕又在鱼C学到东西啦!非常满意{:10_275:} 感谢分享 朕又在鱼C学到东西啦!非常满意{:10_275:} 感谢分享 朕又在鱼C学到东西啦!非常满意{:10_275:} 感谢分享 朕又在鱼C学到东西啦!非常满意{:10_275:} 感谢分享 朕又在鱼C学到东西啦!非常满意{:10_275:}
页:
[1]