API商城
提示词商城
AI大模型
API提供商
API知识库
产品和服务
控制台
所有文章
> 当前标签:
DeepSeek DeepGEMM
DeepSeek 第三天开源的 DeepGEMM
2025/03/08
在DeepSeek开源周的第三天,团队发布了DeepGEMM,这是一个专为Hopper架构GPU优化的矩阵乘法库。DeepGEMM支持标准矩阵计算和混合专家模型(MoE)计算,为DeepSeek-V3/R1的训练和推理提供支持,并在Hopper GPU上实现了1350+ FP8 TFLOPS的高性能。该库的核心代码简洁高效,仅约300行,且在大多数矩阵尺寸下性能优于现有解决方案。DeepGEMM支持三种数据排列方式,包括标准排列和两种专为混合专家模型设计的特殊排列(连续排列和掩码排列),并采用即时编译技术,无需在安装时进行编译。
DeepSeek 新开源项目 DeepGEMM
【AI驱动】
DeepSeek 在开源周第三天推出了专为 Hopper 架构 GPU 优化的矩阵乘法库 DeepGEMM,支持标准矩阵计算和混合专家模型(MoE)计算,为 DeepSeek-V3/R1 的训练和推理提供强大支持,在 Hopper GPU 上达到 1350+FP8 TFLOPS 的高性能。DeepGEMM 的设计理念是简洁高效,核心代码仅约 300 行,同时在大多数矩阵尺寸下性能优于现有解决方案。该库支持三种数据排列方式:标准排列和两种专为混合专家模型设计的特殊排列(连续排列和掩码排列)。DeepGEMM 采用即时编译技术,不需要在安装时进行编译,代码结构清晰易懂,非常适合学习 GPU 优化技术。
2025/02/26
搜索、试用、集成国内外API!
幂简集成
API平台
已有
6403
种API!
API大全
搜索文章