不二如是 发表于 2024-12-31 11:00:00

国产黑马DeepSeek干翻硅谷!雷军又又又赢麻了?!



DeepSeek由知名私募巨头幻方量化孕育而生,幻方量化是中国知名的私募巨头,拥有1万多张A100显卡,为DeepSeek的技术研发提供了强大的硬件支持。

在线学习:

https://www.bilibili.com/video/BV1vj63YAETH


DeepSeek成立于2023年7月,致力于探索人工智能本质,并发布了多个开源大语言模型。

DeepSeek推出了DeepSeek-V3,这是一个强大的混合专家(Mixture-of-Experts, MoE)语言模型,具有671B的MoE和37B的激活参数,并在14.8万亿个高质量token上进行了预训练。

DeepSeek-V3在多个性能基准测试中表现出色,特别是在数学和编程能力上,一度超过GPT-4o和Claude 3.5 Sonnet这两大领先的闭源模型。

DeepSeek使用较少的GPU资源(总量的1/8和GPU小时数的1/11)达到了与GPT4o相媲美的性能。



罗福莉是一位在人工智能领域具有深厚学术背景和丰富实践经验的95后年轻专家。

本科毕业于北京师范大学计算机专业。硕士毕业于北京大学计算语言学专业。

在阿里达摩院(2019年-2022年)工作,负责预训练语言模型相关的工作,主导开发了多语言预训练模型VECO。

曾在幻方量化从事深度学习相关策略建模和算法研究。

在DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2,该模型在中文水平上处于国内外闭源模型的第一梯队。

2024年12月,加入**** Hidden Message *****

tomok 发表于 2025-1-1 14:42:53

真的如此的话,请保护好专家人才!

鱼C-小师妹 发表于 2025-1-7 11:47:46

厉害了

szbin 发表于 2025-1-10 10:40:50

AI开源真的好吗?

sinapark 发表于 2025-1-25 11:42:30

我想说与gpt差距还相当大了,一个问题可以给我不断的发重复的代码,也是醉了

不二如是 发表于 2025-1-26 14:31:21

感谢分享!
页: [1]
查看完整版本: 国产黑马DeepSeek干翻硅谷!雷军又又又赢麻了?!