これはDeepGEMMというWindowsアプリで、最新リリースはStablereleasev2.1.0sourcecode.tar.gzとしてダウンロードできます。ワークステーション向けの無料ホスティングプロバイダーであるOnWorksでオンラインで実行できます。
OnWorks を使用して、DeepGEMM というアプリを無料でダウンロードし、オンラインで実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOSOnWorksオンラインエミュレーターを起動しますが、Windowsオンラインエミュレーターの方が優れています。
-5。起動したばかりのOnWorksWindows OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードしてインストールします。
-7.LinuxディストリビューションソフトウェアリポジトリからWineをダウンロードします。 インストールしたら、アプリをダブルクリックして、Wineで実行できます。 また、人気のあるWindowsプログラムやゲームのインストールに役立つWine上の豪華なインターフェイスであるPlayOnLinuxを試すこともできます。
WineはLinux上でWindowsソフトウェアを実行する方法ですが、Windowsは必要ありません。 Wineは、任意のLinuxデスクトップでWindowsプログラムを直接実行できるオープンソースのWindows互換性レイヤーです。 基本的に、Wineは、実際にWindowsを必要とせずに、これらすべてのWindowsアプリケーションを実行できるように、十分な数のWindowsを最初から再実装しようとしています。
スクリーンショットは
Ad
ディープGEMM
DESCRIPTION
DeepGEMM は、効率的で高性能な一般行列乗算 (GEMM) 演算に特化した CUDA ライブラリです。特に、FP8 (および BF16 の試験的サポート) などの低精度形式に重点を置いています。このライブラリは、過度にテンプレート化されたコードや抽象化されたコードを避け、クリーンかつシンプルに動作するように設計されており、専門家が調整したライブラリに匹敵するパフォーマンスを提供します。標準 GEMM と「グループ化された」GEMM の両方をサポートしており、セグメント化された行列乗算を必要とする Mixture of Experts (MoE) などのアーキテクチャに便利です。DeepGEMM の特徴の 1 つは、実行時にカーネルをコンパイルすることです (軽量の Just-In-Time (JIT) モジュール経由)。そのため、ユーザーはインストール前に CUDA カーネルを事前コンパイルする必要がありません。無駄のない設計にもかかわらず、スケーリング戦略 (きめ細かいスケーリング) と、最先端システム (CUTLASS、CuTe のアイデアを活用) にヒントを得た最適化がより合理化された形で組み込まれています。
オプション
- オプションでBF16をサポートした、FP8精度に重点を置いた高性能GEMMカーネル
- MoEシナリオに便利なグループ化されたGEMM(セグメント化された行列演算)のサポート
- カーネルのランタイム JIT コンパイル (事前の重いカーネル コンパイルは不要)
- クリーンでモジュール化されたコード構造(重いテンプレートプログラミングへの依存が少ない)
- きめ細かなスケーリング戦略(精度を動的に適応させる)
- ベンチマークとテストスイート(例:test_fp8.py)、パフォーマンス監視、継続的な問題追跡
プログラミング言語
C + +
カテゴリー
このアプリケーションは、https://sourceforge.net/projects/deepgemm.mirror/ からも入手できます。OnWorks でホストされているため、無料のオペレーティングシステムから最も簡単にオンラインで実行できます。
