鱼C论坛

 找回密码
 立即注册
查看: 272|回复: 9

[最新资讯] 苹果新论文「质疑DeepSeek-R1,o3等AI没有推理能力」引1000万人围观!

[复制链接]
发表于 2025-6-13 11:00:00 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
b247f42f2004b31f2eef4109746b9bf292d94eba.jpg@308w_174h.jpeg

苹果机器学习团队在2025年6月9日发布论文《TheIllusionofThinking》,系统评估了Deepseek-R1、Claude3.7Sonnet、o3-mini等大型推理模型(LRM)的真实推理能力。研究指出,这些模型在低复杂度任务上表现尚可,但当题目复杂度超过阈值时会出现“准确率断崖式崩溃”,且思考token数量不仅未随难度增加而增加,反而锐减,暗示其所谓“推理”主要依赖记忆。相关推文在X平台迅速获得逾千万次浏览,引发学术界与产业界的大规模讨论。

在现学习:



论文下载:
游客,如果您要查看本帖隐藏内容请回复


为避开常用数学与编程基准测试可能出现的数据污染,论文作者设计了四类逻辑结构稳定且复杂度可控的经典谜题:

TowerofHanoi、PegSolitaire、RiverCrossing与BlocksWorld。

他们通过逐级调高参数细化难度,并用高保真模拟器验证模型每一步动作的合法性,从而量化“思考”轨迹。

实验发现:

  • ①简单场景下,常规模型往往比LRM更快更准;
  • ②当复杂度达到拐点时,两类模型准确率均趋近零,但LRM的崩溃只是稍晚一步;
  • ③LRM在易题上倾向过度思考,而在难题早期即走错后缺乏自我纠错;
  • ④即使提供完整算法步骤,模型仍无法稳定执行,说明其基础逻辑执行与验证能力缺失。

论文发布后,支持者认为这项工作暴露了行业在“大规模记忆+链式思考”路线上的天花板;

批评者则指出实验范围过窄、未评估多模态推理与外部工具调用能力,并揶揄苹果“吃不到葡萄说葡萄酸”。

GaryMarcus等专家称结果“令人警醒”,呼吁行业考虑范式转移;

亦有开发者期待下一代混合架构与工具协同突破瓶颈。无论立场如何,这项研究提醒业界:

若要真正攻克复杂推理,必须深入剖析模型内部思考流程,而不仅依赖堆砌参数或提示工程。

论文发布后,支持者认为这项工作暴露了行业在“大规模记忆+链式思考”路线上的天花板;

批评者则指出实验范围过窄、未评估多模态推理与外部工具调用能力,并揶揄苹果“吃不到葡萄说葡萄酸”。

评论区聊聊你的想法



                               
登录/注册后可看大图




如果有收获,别忘了评分


                               
登录/注册后可看大图


                               
登录/注册后可看大图
                                                                    

评分

参与人数 1荣誉 +2 鱼币 +3 贡献 +3 收起 理由
鱼C-小师妹 + 2 + 3 + 3 鱼C有你更精彩^_^

查看全部评分

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2025-6-13 12:40:40 | 显示全部楼层
敢情是记忆力好是吧?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2025-6-13 13:35:56 | 显示全部楼层
吃不到葡萄说葡萄酸
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2025-6-13 14:29:12 | 显示全部楼层

论文结论是滴
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2025-6-13 14:29:18 | 显示全部楼层
快速收敛 发表于 2025-6-13 13:35
吃不到葡萄说葡萄酸

有这个可能
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2025-6-13 16:48:54 | 显示全部楼层
啊啊啊啊啊啊啊,怎么回四呢

满足我的日常需求了 其他的不关心
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2025-6-14 15:54:21 | 显示全部楼层
啊啊啊啊啊啊啊,怎么回四呢
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2025-6-14 18:36:26 | 显示全部楼层
鱼C-小师妹 发表于 2025-6-14 15:54
啊啊啊啊啊啊啊,怎么回四呢

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2025-6-15 07:34:55 | 显示全部楼层
啊啊啊啊啊啊啊,怎么回四呢
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2025-6-15 10:37:23 | 显示全部楼层
Clay_Chow 发表于 2025-6-15 07:34
啊啊啊啊啊啊啊,怎么回四呢

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-7-4 03:53

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表