|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
DeepSeek由知名私募巨头幻方量化孕育而生,幻方量化是中国知名的私募巨头,拥有1万多张A100显卡,为DeepSeek的技术研发提供了强大的硬件支持。
在线学习:
DeepSeek成立于2023年7月,致力于探索人工智能本质,并发布了多个开源大语言模型。
DeepSeek推出了DeepSeek-V3,这是一个强大的混合专家(Mixture-of-Experts, MoE)语言模型,具有671B的MoE和37B的激活参数,并在14.8万亿个高质量token上进行了预训练。
DeepSeek-V3在多个性能基准测试中表现出色,特别是在数学和编程能力上,一度超过GPT-4o和Claude 3.5 Sonnet这两大领先的闭源模型。
DeepSeek使用较少的GPU资源(总量的1/8和GPU小时数的1/11)达到了与GPT4o相媲美的性能。
罗福莉是一位在人工智能领域具有深厚学术背景和丰富实践经验的95后年轻专家。
本科毕业于北京师范大学计算机专业。硕士毕业于北京大学计算语言学专业。
在阿里达摩院(2019年-2022年)工作,负责预训练语言模型相关的工作,主导开发了多语言预训练模型VECO。
曾在幻方量化从事深度学习相关策略建模和算法研究。
在DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2,该模型在中文水平上处于国内外闭源模型的第一梯队。
2024年12月,加入 |
|