鱼C论坛

 找回密码
 立即注册
查看: 61|回复: 1

[大语言模型] 国产黑马DeepSeek干翻硅谷!雷军又又又赢麻了?!

[复制链接]
发表于 3 天前 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
2c74acec54f0ad244b050b289ffa465bfdde9b10.jpg@308w_174h.jpeg

DeepSeek由知名私募巨头幻方量化孕育而生,幻方量化是中国知名的私募巨头,拥有1万多张A100显卡,为DeepSeek的技术研发提供了强大的硬件支持。

在线学习:




DeepSeek成立于2023年7月,致力于探索人工智能本质,并发布了多个开源大语言模型。

DeepSeek推出了DeepSeek-V3,这是一个强大的混合专家(Mixture-of-Experts, MoE)语言模型,具有671B的MoE和37B的激活参数,并在14.8万亿个高质量token上进行了预训练。

DeepSeek-V3在多个性能基准测试中表现出色,特别是在数学和编程能力上,一度超过GPT-4o和Claude 3.5 Sonnet这两大领先的闭源模型。

DeepSeek使用较少的GPU资源(总量的1/8和GPU小时数的1/11)达到了与GPT4o相媲美的性能。



罗福莉是一位在人工智能领域具有深厚学术背景和丰富实践经验的95后年轻专家。

本科毕业于北京师范大学计算机专业。硕士毕业于北京大学计算语言学专业。

在阿里达摩院(2019年-2022年)工作,负责预训练语言模型相关的工作,主导开发了多语言预训练模型VECO。

曾在幻方量化从事深度学习相关策略建模和算法研究。

在DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2,该模型在中文水平上处于国内外闭源模型的第一梯队。

2024年12月,加入
游客,如果您要查看本帖隐藏内容请回复
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 前天 14:42 | 显示全部楼层
真的如此的话,请保护好专家人才!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-3 10:48

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表