GoGPT Best VPN GoSearch

OnWorks 网站图标

Linux 版 DeepGEMM 下载

免费下载 DeepGEMM Linux 应用程序,在 Ubuntu 在线、Fedora 在线或 Debian 在线运行

这是名为 DeepGEMM 的 Linux 应用程序,其最新版本可以下载为 Stablereleasev2.1.0sourcecode.tar.gz。它可以在免费的工作站托管服务提供商 OnWorks 上在线运行。

免费下载并使用 OnWorks 在线运行这个名为 DeepGEMM 的应用程序。

请按照以下说明运行此应用程序:

- 1. 在您的 PC 中下载此应用程序。

- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。

- 3. 在这样的文件管理器中上传这个应用程序。

- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。

- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。

- 6. 下载应用程序,安装并运行。

SCREENSHOTS

Ad


DeepGEMM


商品描述

DeepGEMM 是一个专用于高效、高性能通用矩阵乘法 (GEMM) 运算的 CUDA 库,尤其侧重于 FP8 等低精度格式(并实验性地支持 BF16)。该库旨在简洁明了地运行,避免过度模板化或高度抽象的代码,同时仍提供可与专家调优库相媲美的性能。它支持标准 GEMM 和“分组”GEMM,这对于像混合专家 (MoE) 这样需要分段矩阵乘法的架构非常有用。DeepGEMM 的一个显著特点是它在运行时编译其内核(通过轻量级的即时 (JIT) 模块),因此用户无需在安装前预编译 CUDA 内核。尽管其设计精简,但它包含了受尖端系统启发的扩展策略(细粒度扩展)和优化(借鉴了 CUTLASS 和 CuTe 的理念),但形式更加精简。



功能

  • 高性能 GEMM 内核专注于 FP8 精度,并可选支持 BF16
  • 支持分组 GEMM(分段矩阵运算),适用于 MoE 场景
  • 内核的运行时 JIT 编译(无需提前进行繁重的内核编译)
  • 干净、模块化的代码结构(减少对繁重模板编程的依赖)
  • 细粒度扩展策略(动态调整精度)
  • 基准和测试套件(例如 test_fp8.py)、性能监控和持续问题跟踪


程式语言

C + +中


分类

人工智能模型

此应用程序也可从 https://sourceforge.net/projects/deepgemm.mirror/ 获取。它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最便捷的方式在线运行。


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad




×
广告
❤️在这里购物、预订或购买——免费,有助于保持服务免费。