Esta es la aplicación para Windows llamada DeepGEMM, cuya última versión se puede descargar como Stablereleasev2.1.0sourcecode.tar.gz. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.
Descargue y ejecute en línea esta aplicación llamada DeepGEMM con OnWorks de forma gratuita.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie cualquier emulador en línea de OS OnWorks desde este sitio web, pero mejor emulador en línea de Windows.
- 5. Desde el sistema operativo OnWorks Windows que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación e instálala.
- 7. Descargue Wine desde los repositorios de software de sus distribuciones de Linux. Una vez instalada, puede hacer doble clic en la aplicación para ejecutarla con Wine. También puedes probar PlayOnLinux, una elegante interfaz sobre Wine que te ayudará a instalar programas y juegos populares de Windows.
Wine es una forma de ejecutar software de Windows en Linux, pero no requiere Windows. Wine es una capa de compatibilidad de Windows de código abierto que puede ejecutar programas de Windows directamente en cualquier escritorio de Linux. Esencialmente, Wine está tratando de volver a implementar una cantidad suficiente de Windows desde cero para poder ejecutar todas esas aplicaciones de Windows sin necesidad de Windows.
SCREENSHOTS
Ad
GEMM profundo
DESCRIPCIÓN
DeepGEMM es una biblioteca CUDA especializada para operaciones de multiplicación de matrices generales (GEMM) eficientes y de alto rendimiento, con especial atención a formatos de baja precisión como FP8 (y compatibilidad experimental con BF16). La biblioteca está diseñada para funcionar de forma limpia y sencilla, evitando código excesivamente plantillado o excesivamente abstracto, a la vez que ofrece un rendimiento que rivaliza con el de las bibliotecas optimizadas por expertos. Admite GEMM estándar y agrupadas, lo que resulta útil para arquitecturas como Mixture of Experts (MoE), que requieren multiplicaciones de matrices segmentadas. Un aspecto distintivo es que DeepGEMM compila sus núcleos en tiempo de ejecución (mediante un módulo ligero Just-In-Time (JIT)), por lo que los usuarios no necesitan precompilar los núcleos CUDA antes de la instalación. A pesar de su diseño ligero, incluye estrategias de escalado (escalado de grano fino) y optimizaciones inspiradas en sistemas de vanguardia (basadas en ideas de CUTLASS y CuTe), pero de forma más simplificada.
Caracteristicas
- Núcleos GEMM de alto rendimiento centrados en la precisión FP8, con soporte opcional para BF16
- Soporte para GEMM agrupado (operaciones de matriz segmentada) útil para escenarios de MoE
- Compilación JIT de kernels en tiempo de ejecución (no se necesita una compilación de kernel pesada con anticipación)
- Estructura de código limpia y modular (menor dependencia de una programación de plantillas pesada)
- Estrategias de escalamiento de grano fino (para adaptar la precisión dinámicamente)
- Conjunto de pruebas y puntos de referencia (por ejemplo, test_fp8.py), supervisión del rendimiento y seguimiento continuo de problemas
Lenguaje de programación
C + +
Categorías
Esta aplicación también se puede descargar desde https://sourceforge.net/projects/deepgemm.mirror/. Está alojada en OnWorks para facilitar su ejecución en línea desde uno de nuestros sistemas operativos gratuitos.
