Este é o aplicativo para Windows chamado DeepGEMM, cuja versão mais recente pode ser baixada como Stablereleasev2.1.0sourcecode.tar.gz. Ele pode ser executado online no provedor de hospedagem gratuita OnWorks para estações de trabalho.
Baixe e execute online este aplicativo chamado DeepGEMM com OnWorks gratuitamente.
Siga estas instruções para executar este aplicativo:
- 1. Baixe este aplicativo em seu PC.
- 2. Entre em nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que você deseja.
- 3. Carregue este aplicativo em tal gerenciador de arquivos.
- 4. Inicie qualquer emulador on-line OS OnWorks a partir deste site, mas um emulador on-line melhor do Windows.
- 5. No sistema operacional OnWorks Windows que você acabou de iniciar, acesse nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que deseja.
- 6. Baixe o aplicativo e instale-o.
- 7. Baixe o Wine de seus repositórios de software de distribuição Linux. Depois de instalado, você pode clicar duas vezes no aplicativo para executá-lo com o Wine. Você também pode experimentar o PlayOnLinux, uma interface sofisticada do Wine que o ajudará a instalar programas e jogos populares do Windows.
Wine é uma forma de executar software Windows no Linux, mas sem a necessidade de Windows. Wine é uma camada de compatibilidade do Windows de código aberto que pode executar programas do Windows diretamente em qualquer desktop Linux. Essencialmente, o Wine está tentando reimplementar o suficiente do Windows do zero para que possa executar todos os aplicativos do Windows sem realmente precisar do Windows.
SCREENSHOTS
Ad
GEMM profundo
DESCRIÇÃO
DeepGEMM é uma biblioteca CUDA especializada para operações de multiplicação geral de matrizes (GEMM) eficientes e de alto desempenho, com foco particular em formatos de baixa precisão, como FP8 (e suporte experimental para BF16). A biblioteca foi projetada para funcionar de forma limpa e simples, evitando códigos excessivamente modelados ou muito abstratos, ao mesmo tempo em que oferece desempenho que rivaliza com bibliotecas ajustadas por especialistas. Ela suporta GEMMs padrão e "agrupados", o que é útil para arquiteturas como Mixture of Experts (MoE), que exigem multiplicações de matrizes segmentadas. Um aspecto distintivo é que o DeepGEMM compila seus kernels em tempo de execução (por meio de um módulo Just-In-Time (JIT) leve), para que os usuários não precisem pré-compilar os kernels CUDA antes da instalação. Apesar de seu design enxuto, ele inclui estratégias de escalonamento (escalonamento refinado) e otimizações inspiradas em sistemas de ponta (baseadas em ideias do CUTLASS e CuTe), mas de forma mais simplificada.
Recursos
- Kernels GEMM de alto desempenho focados na precisão FP8, com suporte BF16 opcional
- Suporte para GEMM agrupado (operações de matriz segmentada) útil para cenários MoE
- Compilação JIT de kernels em tempo de execução (não é necessária nenhuma compilação pesada de kernel com antecedência)
- Estrutura de código limpa e modular (menos dependência de programação de modelos pesados)
- Estratégias de dimensionamento refinadas (para adaptar a precisão dinamicamente)
- Benchmark e conjunto de testes (por exemplo, test_fp8.py), monitoramento de desempenho e rastreamento contínuo de problemas
Linguagem de Programação
C + +
Categorias
Este é um aplicativo que também pode ser obtido em https://sourceforge.net/projects/deepgemm.mirror/. Ele foi hospedado no OnWorks para ser executado online da maneira mais fácil em um de nossos sistemas operacionais gratuitos.
