国产黑马DeepSeek干翻硅谷!雷军又又又赢麻了?!
DeepSeek由知名私募巨头幻方量化孕育而生,幻方量化是中国知名的私募巨头,拥有1万多张A100显卡,为DeepSeek的技术研发提供了强大的硬件支持。
在线学习:
https://www.bilibili.com/video/BV1vj63YAETH
DeepSeek成立于2023年7月,致力于探索人工智能本质,并发布了多个开源大语言模型。
DeepSeek推出了DeepSeek-V3,这是一个强大的混合专家(Mixture-of-Experts, MoE)语言模型,具有671B的MoE和37B的激活参数,并在14.8万亿个高质量token上进行了预训练。
DeepSeek-V3在多个性能基准测试中表现出色,特别是在数学和编程能力上,一度超过GPT-4o和Claude 3.5 Sonnet这两大领先的闭源模型。
DeepSeek使用较少的GPU资源(总量的1/8和GPU小时数的1/11)达到了与GPT4o相媲美的性能。
罗福莉是一位在人工智能领域具有深厚学术背景和丰富实践经验的95后年轻专家。
本科毕业于北京师范大学计算机专业。硕士毕业于北京大学计算语言学专业。
在阿里达摩院(2019年-2022年)工作,负责预训练语言模型相关的工作,主导开发了多语言预训练模型VECO。
曾在幻方量化从事深度学习相关策略建模和算法研究。
在DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2,该模型在中文水平上处于国内外闭源模型的第一梯队。
2024年12月,加入**** Hidden Message ***** 真的如此的话,请保护好专家人才! 厉害了 AI开源真的好吗? 我想说与gpt差距还相当大了,一个问题可以给我不断的发重复的代码,也是醉了 感谢分享!
页:
[1]