马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 不二如是 于 2025-1-27 20:41 编辑
今天 (20250127),“DeepSeek”登上了热搜第一
1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。
1月26日,《黑神话:悟空》制作人冯骥评价DeepSeek:
太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。
DeepSeek何方神圣?
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
在硅谷,DeepSeek很早就被称作“来自东方的神秘力量”,也是网上热议的“杭州六小龙”之一。
在线学习:
真正让DeepSeek火出圈的是2024年12月26日,这家公司宣布上线并同步开源的 DeepSeek-V3模型。
它以1/11的算力、仅2000个GPU芯片训练出性能超越GPT-4o的大模型。
其总训练成本只有557.6万美元,而GPT-4o的约为1亿美元,使用25000个GPU芯片。
双方的成本至少是10倍的差距。
在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o。
(幻方量化「Deepseek」疑“砸碎”这些美股公司金饭碗!核心跑分图)
DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发帖称,DeepSeek-V3是中国科技界带给美国的苦涩教训。
“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”
不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。
据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。
英伟达高级研究科学家Jim Fan在个人社交平台上公开发表推文表示:
我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。
值得注意的是,《纽约时报》称,一些美国立法者正在探索阻止或限制技术开源的可能性。
不过,一些人警告,如果监管机构扼杀了开源技术在美国的进步,中国将获得显著优势。
他们认为,如果最好的开源技术来自中国,美国开发人员将在这些技术的基础上构建其系统。
从长远来看,这可能会让中国成为研发人工智能的中心。
梁文锋是谁?
2025年1月20日下午,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。
在此次座谈会上,共有9人先后发言,其中就有深度求索(DeepSeek)创始人梁文锋。
据报道,梁文锋是位80后,来自广东湛江吴川。
2002年,他以吴川市第一中学“高考第一”的成绩考上浙江大学电子信息工程专业,毕业后在浙江大学攻读研究生。
在大学期间,梁文锋就已积累市场行情数据和探索全自动量化交易。
2023年5月,38岁的梁文锋宣布做通用人工智能(AGI)。
7月,他正式创办杭州深度求索人工智能基础技术研究有限公司,就是DeepSeek公司,专注于AI大模型的研究和开发,公司设在杭州。
有同事评价梁文锋:完全不像一个老板,而更像一个极客。因为作为老板,他本人每天都在写代码、跑代码,学习能力惊人。
预知更多神文请看:
如果有收获,别忘了评分 :
如此多懂学习的 VIP至尊都 已订阅本专辑,你还不快点行动!( ->订阅传送门 ) |