「DeepMind」首席科学家『周丹尼』:AI几年内解决编码问题其实非常困难!
谷歌DeepMind首席科学家DennyZhou指出,AI几年内解决编码问题其实非常困难。
这主要因为日常编程需要处理多样化的业务逻辑、系统依赖、API集成以及非结构化问题等,这与竞赛编程中的限制性算法题有本质区别。
目前虽然LLM模型在生成简单函数和示例代码方面已展现出惊人能力,但在复杂项目环境下识别上下文、管理依赖和持续维护的能力仍待提升。
在线学习:
https://www.bilibili.com/video/BV1UZjMzYEUb
乐观者往往只论竞技编程的进展,强调模型在LeetCode、Kattis等平台上刷题的表现。
但这些问题通常具有明确输入输出规范和固定测试样例,而真实生产环境中的编码任务更像是一种开放式挑战,需要考虑架构设计、性能优化以及多线程并发等多方面因素。
例如,研究表明在标准编程竞赛数据集上的平均正确率可以达到70%以上,但在真实项目代码生成和自我修复场景中,即使是自调试(Self-Debugging)方法也只能将最复杂难题的准确率提升约9%至12%。
因此,竞技编程的成功不能直接等同于AI在软件工程全流程中的成熟度。
尽管如此,谷歌DeepMind的推理团队通过链式思维(Chain-of-Thought)、自一致性(Self-Consistency)和最少到最多(Least-to-Most)等技术不断缩小人机差距。
推动模型在推理和分解任务上的能力提升,但要真正实现AI在端到端软件开发中的应用,还需解决语义理解、上下文保持以及与外部系统交互的长期挑战。
在Transformer架构上亦有学者提出,只要允许生成足够多的中间推理标记,就能从理论上解决任意问题。
但实践中受限于计算资源和响应时间,这种方法难以直接应用于日常编码场景。
未来的研究方向包括增强模型的环境感知能力、跨模态协同以及动态智能体(Agent)架构,这些进展将为AI最终胜任复杂软件开发任务奠定基础。
人物简介
DennyZhou,现任谷歌DeepMind推理团队(ReasoningTeam)创始人兼负责人,致力于通过构建具备链式思维、最少到最多等能力的LLM模型实现人工通用智能(AGI)。
**** Hidden Message *****
评论区聊聊你的想法吧{:10_330:}
https://xxx.ilovefishc.com/forum/202505/12/120451wiv7viv5iebupbbr.png
>>万能兑换C币许愿池<<
如果有收获,别忘了评分{:10_281:} :
https://xxx.ilovefishc.com/forum/202011/20/092334ggd6inlzfisfrdir.png.thumb.jpg
https://xxx.ilovefishc.com/forum/202505/21/111710rvxgdn90vaub5gag.gif AI写代码就是容易一错再错,代码报错问ai他就是死不悔改。。。 player-none 发表于 2025-5-26 17:11
AI写代码就是容易一错再错,代码报错问ai他就是死不悔改。。。
是的{:10_250:} 感谢分享!!鱼C论坛不愧是全国最大的AI资讯学习论坛!朕很喜欢这里{:10_275:}
Claude-4貌似很强,感觉几年有点说慢了{:10_254:} 感谢分享!!鱼C论坛不愧是全国最大的AI资讯学习论坛!朕很喜欢这里{:10_275:} 画风华 发表于 2025-5-27 16:26
感谢分享!!鱼C论坛不愧是全国最大的AI资讯学习论坛!朕很喜欢这里
{:10_288:}{:10_288:}{:10_288:} 快速收敛 发表于 2025-5-27 08:39
感谢分享!!鱼C论坛不愧是全国最大的AI资讯学习论坛!朕很喜欢这里
Claude-4貌似很强,感觉 ...
claude4目前编程类最强 感谢分享!!鱼C论坛不愧是全国最大的AI资讯学习论坛!朕很喜欢这里{:10_275:}
页:
[1]