鱼C论坛

 找回密码
 立即注册
查看: 50|回复: 3

[大语言模型] 0 1 5 d - DeepSeek爆火登顶!神秘东方力量“震惊”硅谷?最新……

[复制链接]
发表于 3 天前 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 不二如是 于 2025-1-27 20:41 编辑

今天 (20250127),“DeepSeek”登上了热搜第一


10003.jpeg

1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。

10004.png

同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。

10005.png

1月26日,《黑神话:悟空》制作人冯骥评价DeepSeek:

太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。


10006.png

DeepSeek何方神圣?

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。

在硅谷,DeepSeek很早就被称作“来自东方的神秘力量”,也是网上热议的“杭州六小龙”之一。

在线学习:



真正让DeepSeek火出圈的是2024年12月26日,这家公司宣布上线并同步开源的 DeepSeek-V3模型。

它以1/11的算力、仅2000个GPU芯片训练出性能超越GPT-4o的大模型。

其总训练成本只有557.6万美元,而GPT-4o的约为1亿美元,使用25000个GPU芯片。

双方的成本至少是10倍的差距。

在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o
幻方量化「Deepseek」疑“砸碎”这些美股公司金饭碗!核心跑分图

10007.jpeg

DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发帖称,DeepSeek-V3是中国科技界带给美国的苦涩教训。

“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”

不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。

10008.png

据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

英伟达高级研究科学家Jim Fan在个人社交平台上公开发表推文表示:

我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。


值得注意的是,《纽约时报》称,一些美国立法者正在探索阻止或限制技术开源的可能性。

不过,一些人警告,如果监管机构扼杀了开源技术在美国的进步,中国将获得显著优势。

他们认为,如果最好的开源技术来自中国,美国开发人员将在这些技术的基础上构建其系统。

从长远来看,这可能会让中国成为研发人工智能的中心。

梁文锋是谁?

2025年1月20日下午,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。

在此次座谈会上,共有9人先后发言,其中就有深度求索(DeepSeek)创始人梁文锋。

10010.png

据报道,梁文锋是位80后,来自广东湛江吴川。

2002年,他以吴川市第一中学“高考第一”的成绩考上浙江大学电子信息工程专业,毕业后在浙江大学攻读研究生。

在大学期间,梁文锋就已积累市场行情数据和探索全自动量化交易。

2023年5月,38岁的梁文锋宣布做通用人工智能(AGI)。

7月,他正式创办杭州深度求索人工智能基础技术研究有限公司,就是DeepSeek公司,专注于AI大模型的研究和开发,公司设在杭州。

有同事评价梁文锋:完全不像一个老板,而更像一个极客。因为作为老板,他本人每天都在写代码、跑代码,学习能力惊人。

10011.jpeg




预知更多神文请看:


如果有收获,别忘了评分


                               
登录/注册后可看大图


如此多懂学习的VIP至尊已订阅本专辑,你还不快点行动!(->订阅传送门 )
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 3 天前 | 显示全部楼层
感谢分享!学到啦!!!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 3 天前 | 显示全部楼层
@FishC 科普DeepSeek
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 3 天前 | 显示全部楼层


DeepSeek 简介

DeepSeek 是一种将深度学习技术应用于大规模数据分析和信息检索的工具或框架。它通常用于挖掘和识别数据中的隐藏模式,从而提高数据处理和决策制定的效率。

  • 深度学习:利用神经网络来处理复杂数据模型,通常在图像、文本和语音识别中表现出色。
  • 大规模数据分析:能够处理海量数据,并从中提取有价值的信息。
  • 信息检索:帮助快速找到相关信息,提高信息查找的精度和速度。


如果你有其他具体问题或想了解更多,随时问我!

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-30 13:04

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表