Este é o aplicativo Linux chamado CUTLASS cuja versão mais recente pode ser baixada como CUTLASS3.2.1.zip. Ele pode ser executado online no provedor de hospedagem gratuito OnWorks para estações de trabalho.
Baixe e execute online este aplicativo chamado CUTLASS com OnWorks gratuitamente.
Siga estas instruções para executar este aplicativo:
- 1. Baixe este aplicativo em seu PC.
- 2. Entre em nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que você deseja.
- 3. Carregue este aplicativo em tal gerenciador de arquivos.
- 4. Inicie o emulador OnWorks Linux online ou Windows online ou emulador MACOS online a partir deste site.
- 5. No sistema operacional OnWorks Linux que você acabou de iniciar, acesse nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que deseja.
- 6. Baixe o aplicativo, instale-o e execute-o.
SCREENSHOTS
Ad
CUTELO
DESCRIÇÃO
CUTLASS é uma coleção de abstrações de modelo CUDA C++ para implementação de multiplicação de matrizes de alto desempenho (GEMM) e cálculos relacionados em todos os níveis e escalas dentro de CUDA. Ele incorpora estratégias para decomposição hierárquica e movimentação de dados semelhantes àquelas usadas para implementar cuBLAS e cuDNN. CUTLASS decompõe essas "partes móveis" em componentes de software modulares e reutilizáveis abstraídos por classes de modelo C++. Essas primitivas de largura de thread, largura de distorção, largura de bloco e largura de dispositivo podem ser especializadas e ajustadas por meio de tamanhos de ladrilhos personalizados, tipos de dados e outras políticas algorítmicas. A flexibilidade resultante simplifica seu uso como blocos de construção em kernels e aplicativos personalizados. Para suportar uma ampla variedade de aplicações, o CUTLASS fornece amplo suporte para cálculos de precisão mista, fornecendo movimentação de dados especializada e abstrações de acumulação múltipla para ponto flutuante de meia precisão (FP16), BFloat16 (BF16), Tensor Float 32 (TF32), etc.
Funcionalidades
- CUTLASS implementa Convolução de alto desempenho por meio do algoritmo GEMM implícito
- O GEMM implícito é a formulação de uma operação de convolução como um GEMM, aproveitando assim o pipeline GEMM modular do CUTLASS
- Construa convoluções reutilizando componentes GEMM altamente otimizados e abaixo
- Kernels de convolução de primeira camada especializados para pequenas contagens de canais e alinhamento reduzido
- Operadores BLAS3 acelerados por Tensor Cores
- Desempenho ideal usando CUDA 11.7
Linguagem de Programação
C + +
Categorias
Este é um aplicativo que também pode ser obtido em https://sourceforge.net/projects/cutlass.mirror/. Ele foi hospedado em OnWorks para ser executado online da maneira mais fácil a partir de um de nossos Sistemas Operativos gratuitos.