鱼C论坛

 找回密码
 立即注册
查看: 38|回复: 3

[最新资讯] 谷歌「Gemini 3.1 Flash-Lite」深夜掀桌!每秒狂飙363 token/s!1/4价格+5倍的速度

[复制链接]
发表于 昨天 18:00 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
5c87d90a34a34bcdcc5428dbd7194750c3fe7529.jpg@308w_174h.jpeg

最近,谷歌正式发布了新模型Gemini 3.1 Flash-Lite。

先看最直观的数据:

它的输出速度达到363 tokens/s,这个速度在当前同级模型里非常夸张。

在线学习:



作为对比,GPT-5 mini大约是71 tokens/s,Claude 4.5 Haiku约108 tokens/s,也就是说Flash-Lite在输出速度上几乎是GPT-5 mini的5倍、Claude的3倍以上。

与此同时,它的API价格也非常激进,输入价格为每百万token 0.25美元,输出1.5美元,而Claude 4.5 Haiku的输出价格约5美元,整体成本明显更低。

速度和价格之外,它的性能指标也不差。

在学术推理测试GPQA Diamond中,Gemini 3.1 Flash-Lite取得86.9%的成绩,这类测试主要考察接近博士级别的科学推理能力,成绩已经超过不少同级模型。

在多模态理解测试中,它也表现稳定,说明该模型并不是单纯依靠速度取胜,而是在推理能力和多模态任务上保持了较强水平。

对于需要高吞吐量任务的场景,比如内容生成、翻译、代码分析或大规模数据处理,这种性能与成本的组合非常有吸引力。

更值得注意的是,Flash-Lite引入了可调推理深度的设计。

开发者可以根据任务复杂度自由选择“浅思考”或“深推理”。

简单分类或批处理任务可以走快速路径,把延迟和成本压到最低;

而多步骤推理、复杂分析则可以开启更深层计算,让效果接近更大的模型。

这其实反映出AI行业竞争逻辑的变化:

过去两年,各家都在比谁的模型更聪明、谁在榜单上跑分更高;

但Flash-Lite把重点转向真实产品场景里的两个核心指标——速度和成本。

当AI开始规模化落地时,性价比往往比极限跑分更重要,而谷歌显然正在这条赛道上提前布局。

评论区聊聊你的想法



                               
登录/注册后可看大图




如果有收获,别忘了评分


                               
登录/注册后可看大图


                               
登录/注册后可看大图
                                                                    
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 昨天 18:14 | 显示全部楼层
感谢分享 朕又在鱼C学到东西啦!非常满意
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 20:49 | 显示全部楼层
感谢分享 朕又在鱼C学到东西啦!非常满意
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 22:50 | 显示全部楼层
感谢分享 朕又在鱼C学到东西啦!非常满意
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-3-7 04:34

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表