Ito ang Linux app na pinangalanang CUTLASS na ang pinakabagong release ay maaaring i-download bilang CUTLASS4.2.0sourcecode.tar.gz. Maaari itong patakbuhin online sa libreng hosting provider na OnWorks para sa mga workstation.
I-download at patakbuhin online ang app na ito na pinangalanang CUTLASS sa OnWorks nang libre.
Sundin ang mga tagubiling ito upang patakbuhin ang app na ito:
- 1. Na-download ang application na ito sa iyong PC.
- 2. Ipasok sa aming file manager https://www.onworks.net/myfiles.php?username=XXXXX kasama ang username na gusto mo.
- 3. I-upload ang application na ito sa naturang filemanager.
- 4. Simulan ang OnWorks Linux online o Windows online emulator o MACOS online emulator mula sa website na ito.
- 5. Mula sa OnWorks Linux OS na kasisimula mo pa lang, pumunta sa aming file manager https://www.onworks.net/myfiles.php?username=XXXX gamit ang username na gusto mo.
- 6. I-download ang application, i-install ito at patakbuhin ito.
MGA LALAKI
Ad
CUTLASS
DESCRIPTION
Ang CUTLASS ay isang koleksyon ng mga abstraction ng template ng CUDA C++ para sa pagpapatupad ng high-performance matrix-multiplication (GEMM) at mga kaugnay na computations sa lahat ng antas at sukat sa loob ng CUDA. Isinasama nito ang mga estratehiya para sa hierarchical decomposition at paggalaw ng data na katulad ng mga ginamit upang ipatupad ang cuBLAS at cuDNN. Binubulok ng CUTLASS ang "mga gumagalaw na bahagi" na ito sa magagamit muli, modular na mga bahagi ng software na na-abstract ng mga klase ng template ng C++. Ang mga thread-wide, warp-wide, block-wide, at device-wide primitive na ito ay maaaring gawing espesyalisado at i-tune sa pamamagitan ng custom na laki ng tiling, mga uri ng data, at iba pang algorithmic na patakaran. Ang nagreresultang flexibility ay pinapasimple ang kanilang paggamit bilang mga bloke ng gusali sa loob ng mga custom na kernel at application. Upang suportahan ang isang malawak na iba't ibang mga application, ang CUTLASS ay nagbibigay ng malawak na suporta para sa mixed-precision computations, na nagbibigay ng espesyal na data-movement at multiply-accumulate abstraction para sa half-precision floating point (FP16), BFloat16 (BF16), Tensor Float 32 (TF32), atbp.
Mga tampok
- Ang CUTLASS ay nagpapatupad ng high-performance na Convolution sa pamamagitan ng implicit na GEMM algorithm
- Ang implicit na GEMM ay ang pagbabalangkas ng isang convolution operation bilang isang GEMM sa gayo'y sinasamantala ang modular GEMM pipeline ng CUTLASS
- Bumuo ng mga convolution sa pamamagitan ng muling paggamit ng lubos na na-optimize na warp-wide na mga bahagi ng GEMM at sa ibaba
- Ang mga kernel ng Convolution ng unang layer ay dalubhasa para sa maliliit na bilang ng channel at pinababang pagkakahanay
- Ang mga operator ng BLAS3 ay pinabilis ng Tensor Cores
- Pinakamainam na pagganap gamit ang CUDA 11.7
Wika ng Programming
C + +
Kategorya
Ito ay isang application na maaari ding makuha mula sa https://sourceforge.net/projects/cutlass.mirror/. Na-host ito sa OnWorks upang mapatakbo online sa pinakamadaling paraan mula sa isa sa aming mga libreng Operative System.