鱼C论坛

 找回密码
 立即注册
查看: 51|回复: 0

[最新资讯] 「DeepSeek」绕开CUDA垄断!英伟达护城河不存在了?!

[复制链接]
发表于 昨天 15:00 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
525c82ee9df7a40b9966a72647a2c05b0614be88.jpg@308w_174h.jpeg

PTX是CUDA的中间表示:PTX是英伟达为GPU设计的一种中间指令集架构,位于高级GPU编程语言(如CUDA C/C++)和低级机器代码(SASS,Streaming Assembly)之间。

在常规的CUDA开发流程中,CUDA代码首先被编译为PTX代码,然后PTX代码再被进一步编译为目标GPU架构的机器码。

CUDA提供高级接口:CUDA作为一种高级编程语言,为开发者提供了更简洁的开发接口和工具链,能够简化并行编程的复杂性,同时支持快速迭代开发。

而PTX则更接近底层硬件,允许开发者进行细粒度的优化,如寄存器分配、线程/线程束级别的调整等。

在线学习:



DeepSeek如何使用PTX绕过CUDA限制

直接编写PTX代码:DeepSeek在训练其V3模型时,直接使用PTX语言对英伟达H800 GPU进行了底层优化。例如,他们将132个流式多处理器(SMs)中的20个重新配置为负责服务器间的通信任务,而不是计算任务,从而变相绕过了硬件对通信速度的限制。

实现细粒度优化:
游客,如果您要查看本帖隐藏内容请回复


DeepSeek通过使用英伟达的PTX(Parallel Thread Execution,并行线程执行)语言,实现了对CUDA的“绕过”,从而在GPU硬件上实现了更极致的性能优化。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-31 06:35

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表