奥特曼发布「GPT-5」人人免费用「博士级」智能,基准图错误遭全网吐槽!
我们一脸的期待,直播中 OpenAI 几位核心人员的紧张也肉眼可见。
尽管奥特曼强调 benchmark 不重要,但他们还是晒出了不少跑分结果,比如在数学、编程、视觉感知和健康领域。
在线学习(提示:不如......好用):
https://www.bilibili.com/video/BV1GKtyzNE6R
具体跑分如下:
数学领域:在 2025 年 AIME 测试中无工具辅助达到 94.6%实际编程应用。
SWE-bench Verified 达到 74.9%,Aider Polyglot 达到 88%多模态理解:MMMU 达到 84.2%健康领域:HealthBench Hard 达到 46.2%通过 GPT-5 pro 的扩展推理能力,该模型还在 GPQA 测试中创造了新的 SOTA,在无工具辅助的情况下得分 88.4%。
费用方面,GPT-5 分为免费版、Plus 和 Pro 计划。
根据奥特曼的说法,免费版也能用上「博士级别的智能」(GPT-5 普通版,但带推理功能),Plus 用户在使用频率上限制更少,而 Pro 用户可以用上 GPT-5 Pro。
面向开发者,GPT-5 的三个版本 API 价格如下。
标准版 GPT-5 为每百万输入 Token 1.25 美元,每百万输出 Token 10 美元,GPT-5 mini 版 与 Nano 版会更便宜。
评论区聊聊你的想法吧{:10_330:}
https://xxx.ilovefishc.com/forum/202505/12/120451wiv7viv5iebupbbr.png
>>万能兑换C币许愿池<<
如果有收获,别忘了评分{:10_281:} :
https://xxx.ilovefishc.com/forum/202011/20/092334ggd6inlzfisfrdir.png.thumb.jpg
https://xxx.ilovefishc.com/forum/202505/21/111710rvxgdn90vaub5gag.gif 不如@....好用 关于GPT-5的发布,我的看法如下:
[*]性能亮点:
数学领域94.6%和编程74.9%的跑分确实惊艳,尤其是无工具辅助能达到这种水平。多模态理解MMMU 84.2%说明图文处理能力大幅提升,但健康领域46.2%显示专业垂直场景仍有优化空间。
[*]免费策略解析:
所谓「博士级智能免费」可能有限制:
- 免费版大概率会限频次/降响应速度
- Pro版的扩展推理能力和GPQA 88.4%才是完全体
- 参考历史版本,免费用户可能无法使用文件解析等高级功能
[*]开发者成本对比:
API定价输入$1.25/百万token比GPT-4 Turbo(输入$10/百万)便宜87.5%,但输出$10/百万token比旧版($30)降66%仍偏高,适合轻量交互场景。
大家觉得「免费版博士智能」是技术普惠还是营销话术?实际体验能否达到宣传效果?欢迎讨论~{:10_330:}
以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。 秒来! 不如@FishC好用 不如Deepseek好用 不如Gork好用 不如@FishC好用 不如@FishC好用 不如@FishC好用 不如grok好用 nizitao 发表于 2025-8-8 13:52
不如grok好用
是吗??平时用grok4? 不如Fishc好用 不如@FishC好用 sfqxx 发表于 2025-8-8 11:32
不如@FishC好用
不如......好用不如@FishC好用 不二如是 发表于 2025-8-8 14:13
是吗??平时用grok4?
不是,用3,grok4用不起{:10_277:} 挺好用~~
页:
[1]