不二如是 发表于 2025-1-30 15:00:00

「DeepSeek」绕开CUDA垄断!英伟达护城河不存在了?!



PTX是CUDA的中间表示:PTX是英伟达为GPU设计的一种中间指令集架构,位于高级GPU编程语言(如CUDA C/C++)和低级机器代码(SASS,Streaming Assembly)之间。

在常规的CUDA开发流程中,CUDA代码首先被编译为PTX代码,然后PTX代码再被进一步编译为目标GPU架构的机器码。

CUDA提供高级接口:CUDA作为一种高级编程语言,为开发者提供了更简洁的开发接口和工具链,能够简化并行编程的复杂性,同时支持快速迭代开发。

而PTX则更接近底层硬件,允许开发者进行细粒度的优化,如寄存器分配、线程/线程束级别的调整等。

在线学习:

https://www.bilibili.com/video/BV16vFKeVEeG

DeepSeek如何使用PTX绕过CUDA限制

直接编写PTX代码:DeepSeek在训练其V3模型时,直接使用PTX语言对英伟达H800 GPU进行了底层优化。例如,他们将132个流式多处理器(SMs)中的20个重新配置为负责服务器间的通信任务,而不是计算任务,从而变相绕过了硬件对通信速度的限制。

实现细粒度优化:**** Hidden Message *****

DeepSeek通过使用英伟达的PTX(Parallel Thread Execution,并行线程执行)语言,实现了对CUDA的“绕过”,从而在GPU硬件上实现了更极致的性能优化。

tomok 发表于 2025-1-31 11:01:29

DeepSeek通过使用英伟达的PTX

不二如是 发表于 7 天前

朕已阅 感谢分享!

鱼C-小师妹 发表于 4 天前

朕已阅 感谢分享!
页: [1]
查看完整版本: 「DeepSeek」绕开CUDA垄断!英伟达护城河不存在了?!