This is the Windows app named DeepGEMM whose latest release can be downloaded as Stablereleasev2.1.0sourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
Download and run online this app named DeepGEMM with OnWorks for free.
Bu uygulamayı çalıştırmak için şu talimatları izleyin:
- 1. Bu uygulamayı PC'nize indirdiniz.
- 2. Dosya yöneticimize https://www.onworks.net/myfiles.php?username=XXXXX istediğiniz kullanıcı adını girin.
- 3. Bu uygulamayı böyle bir dosya yöneticisine yükleyin.
- 4. Bu web sitesinden herhangi bir OS OnWorks çevrimiçi öykünücüsünü başlatın, ancak daha iyi Windows çevrimiçi öykünücüsü.
- 5. Yeni başlattığınız OnWorks Windows işletim sisteminden, istediğiniz kullanıcı adıyla https://www.onworks.net/myfiles.php?username=XXXXX dosya yöneticimize gidin.
- 6. Uygulamayı indirin ve kurun.
- 7. Wine'ı Linux dağıtımları yazılım havuzlarınızdan indirin. Kurulduktan sonra, Wine ile çalıştırmak için uygulamaya çift tıklayabilirsiniz. Ayrıca, popüler Windows programlarını ve oyunlarını yüklemenize yardımcı olacak Wine üzerinden gösterişli bir arayüz olan PlayOnLinux'u da deneyebilirsiniz.
Wine, Windows yazılımını Linux üzerinde çalıştırmanın bir yoludur, ancak Windows gerektirmez. Wine, Windows programlarını doğrudan herhangi bir Linux masaüstünde çalıştırabilen açık kaynaklı bir Windows uyumluluk katmanıdır. Esasen Wine, Windows'a ihtiyaç duymadan tüm bu Windows uygulamalarını çalıştırabilmesi için yeterince Windows'u sıfırdan yeniden uygulamaya çalışıyor.
EKRAN
Ad
DerinGEMM
AÇIKLAMA
DeepGEMM is a specialized CUDA library for efficient, high-performance general matrix multiplication (GEMM) operations, with particular focus on low-precision formats such as FP8 (and experimental support for BF16). The library is designed to work cleanly and simply, avoiding overly templated or heavily abstracted code, while still delivering performance that rivals expert-tuned libraries. It supports both standard and “grouped” GEMMs, which is useful for architectures like Mixture of Experts (MoE) that require segmented matrix multiplications. One distinguishing aspect is that DeepGEMM compiles its kernels at runtime (via a lightweight Just-In-Time (JIT) module), so users don’t need to precompile CUDA kernels before installation. Despite its lean design, it includes scaling strategies (fine-grained scaling) and optimizations inspired by cutting edge systems (drawing from ideas in CUTLASS, CuTe) but in a more streamlined form.
Özellikler
- High-performance GEMM kernels focused on FP8 precision, with optional BF16 support
- Support for grouped GEMM (segmented matrix operations) useful for MoE scenarios
- Runtime JIT compilation of kernels (no heavy ahead-of-time kernel compilation needed)
- Clean, modular code structure (less dependence on heavy template programming)
- Fine-grained scaling strategies (to adapt precision dynamically)
- Benchmark and test suite (e.g. test_fp8.py), performance monitoring, and ongoing issue tracking
Programlama dili
C + +
Kategoriler
This is an application that can also be fetched from https://sourceforge.net/projects/deepgemm.mirror/. It has been hosted in OnWorks in order to be run online in an easiest way from one of our free Operative Systems.