|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
在线学习:
OpenAI o3发布:OpenAI在12天的直播中发布了o3,这是继o1之后的新一代AI模型,被认为是通往人工通用智能(AGI)的重要一步。
性能提升:o3在多个领域展现出超越现有模型的能力,包括软件工程、编程竞赛、数学竞赛等。
避免商标冲突:OpenAI跳过o2直接发布o3,以避免与英国电信服务提供商O2的版权或商标冲突。
评测结果:
- 软件工程考试(SWE-Bench Verified):o3得分71.7%,超过o1。
- Codeforces:o3得分2727,相当于全球榜单第175名,超越99.99%的人类。
- AIEM 2024:接近满分,是AI首次接近满分的成绩。
- FrontierMath:o3达到了25.2%的成功率,远超其他模型。
- ARC-AGI:o3的分数达到了87.5%,接近人类的85%阈值。
- 模型访问:o3目前仅对红队开放,但OpenAI基于o3训练了3个小尺寸模型,其中o3-mimi预计1月底对外开放。
OpenAI在这12天直播中的其他发布和更新,包括o1的上线、ChatGPT Pro会员上线、Sora发布、ChatGPT Canvas全员开放等。
|
|