DeepSeek 开源周第三日宣布推出 DeepGEMM,一个支持密集和 MoE GEMM 的 FP8 GEMM 库,为 V3/R1 训练和推理提供支持。
该库采用 CUDA 编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。
相关阅读:
DeepSeek 开源周第二日:开源 DeepEP 通信库
评论删除后,数据将无法恢复
DeepSeek 开源周第三日:开源 DeepGEMM
DeepSeek 开源周第三日宣布推出 DeepGEMM,一个支持密集和 MoE GEMM 的 FP8 GEMM 库,为 V3/R1 训练和推理提供支持。
该库采用 CUDA 编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。
相关阅读:
DeepSeek 开源周第二日:开源 DeepEP 通信库