鱼C论坛

 找回密码
 立即注册
查看: 54|回复: 8

[最新资讯] AI之父「Yann LeCun」杨立昆坦言:人们对「DeepSeek R2」开源反应过度

[复制链接]
发表于 5 小时前 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
c5e544c3dbf4230dfa76f6e006f22237267bb8da.jpg@308w_174h.jpeg

从技术层面来看,DeepSeek-Prover-V2-671B使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。

更令人惊叹的是,其最大位置嵌入达到了16.38万,这意味着它能够处理极其复杂的数学证明问题。

在线感受:



DeepSeek-Prover是DeepSeek团队开发的一系列专注于数学定理证明的开源大语言模型,通过大规模合成数据训练并结合强化学习(RL)与蒙特卡洛树搜索(MCTS)等优化技术,在形式化定理证明领域取得了显著进展。

DeepSeek-Prover通过创新的训练框架与高效的推理策略,在形式化数学证明领域树立了新标杆。

其结合合成数据、强化学习与树搜索的技术路径,不仅提升了模型性能,也为AI在严谨数学推理中的应用开辟了新方向。


AI之父介绍

Yann André LeCun,1960年出生于法国巴黎附近。他是人工智能领域的杰出科学家,被誉为“卷积神经网络之父”。

1983年,LeCun毕业于巴黎电子工程学院,1987年在Université P&M Curie(今天的索邦大学)获得计算机科学博士学位。

他的研究领域包括人工智能、机器学习、计算机视觉、机器人技术等。

1988年,LeCun加入贝尔实验室,1996年加入AT&T实验室,并成为图像处理研究部门的领导。

2003年,他在纽约大学担任教授,并在NEC研究所(普林斯顿)短暂工作过。

2012年,LeCun成为纽约大学数据科学中心的创办主任。

2013年末,他受邀成为Meta(Facebook)公司的人工智能研究中心负责人,并仍保持在纽约大学中兼职教学。

2019年,他与约书亚·本希奥以及杰弗里·辛顿共同获得计算机学界最高奖项——图灵奖。

LeCun是美国国家科学院、美国国家工程院和法国科学院的院士。


DeepSeek创始人梁文锋曾表示:

中国也要逐步成为创新贡献者,而不是一直搭便车。

他将探索通用人工智能的本质作为核心使命。

评论区聊聊你的想法


如果有收获,别忘了评分


                               
登录/注册后可看大图



                               
登录/注册后可看大图



                               
登录/注册后可看大图


小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 5 小时前 | 显示全部楼层
感谢分享,朕又在鱼C学到最前沿的AI知识啦
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 5 小时前 | 显示全部楼层
@FishC 介绍梁文锋
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 5 小时前 | 显示全部楼层


关于“梁文锋”的说明

您好!经查询,目前公开资料中并未找到与 FishC(鱼C工作室) 直接关联的“梁文锋”相关信息。可能的情况包括:

  • 名字可能存在拼写误差(如“梁文锋”是否为“梁文峰”或其他相近名称?)
  • 可能是社区内未被公开提及的成员或贡献者
  • 可能是用户混淆了其他技术社区的人物信息


如果您能提供更多背景信息(例如具体领域、关联项目等),我将尽力协助核实!

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 5 小时前 | 显示全部楼层
技术亮点解析  
DeepSeek-Prover-V2-671B的技术架构确实令人瞩目:  
      
  • 采用DeepSeek-V3架构与MoE混合专家模式  
  • 61层Transformer结构,隐藏层维度达7168  
  • 支持最大16.38万token的超长上下文处理  
  

创新突破  
模型通过以下技术组合实现突破:  
1. 大规模合成数据训练  
2. 强化学习(RL)+蒙特卡洛树搜索(MCTS)优化  
3. 专门针对数学证明任务的架构设计


在线体验地址:  
https://www.bilibili.com/video/BV1Y6JFz9Ejb  

AI先驱档案  
      
  • Yann LeCun主要成就:  
        
    • 1988年开发首个卷积神经网络  
    • 2019年图灵奖得主(与Hinton/Bengio共享)  
    • Meta首席AI科学家,纽约大学教授  
      
  • 学术贡献:  
        
    • 推动深度学习在计算机视觉的应用  
    • 提出LSTM网络等基础架构  
  

梁文锋观点摘录  
"中国要成为创新贡献者而非搭便车者  
探索AGI本质是我们的核心使命"


讨论引导  
您如何看待:  
      
  • 开源大模型对科研生态的影响  
  • AI在形式化数学证明中的潜力  
  • 中国团队在基础研究中的角色转变  
  

(评分图片暂无法显示,请至原帖查看)  

>>万能兑换C币许愿池  
(此处应为用户互动内容)


以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 5 小时前 | 显示全部楼层
感谢分享,朕又在鱼C学到最前沿的AI知识啦

DeepSeek遥遥领先!
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 4 小时前 | 显示全部楼层
感谢分享,朕又在鱼C学到最前沿的AI知识啦

加油我的国  希望这次在AI领域,能够逆风翻盘,由应用强国转变为创新强国

评分

参与人数 1鱼币 +2 C币 +1 收起 理由
不二如是 + 2 + 1 说得好

查看全部评分

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 3 小时前 | 显示全部楼层
快速收敛 发表于 2025-5-20 08:38
感谢分享,朕又在鱼C学到最前沿的AI知识啦

DeepSeek遥遥领先!

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 3 小时前 | 显示全部楼层
爬虫121 发表于 2025-5-20 09:08
感谢分享,朕又在鱼C学到最前沿的AI知识啦

加油我的国  希望这次在AI领域,能够逆风翻盘,由应 ...

鱼C有你更精彩
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-5-20 13:50

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表