To aplikacja dla systemu Linux o nazwie CUTLASS, której najnowszą wersję można pobrać jako CUTLASS4.1.0sourcecode.tar.gz. Można ją uruchomić online na bezpłatnym hostingu OnWorks dla stacji roboczych.
Pobierz i uruchom online tę aplikację o nazwie CUTLASS z OnWorks za darmo.
Postępuj zgodnie z tymi instrukcjami, aby uruchomić tę aplikację:
- 1. Pobrałem tę aplikację na swój komputer.
- 2. Wpisz w naszym menedżerze plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.
- 3. Prześlij tę aplikację w takim menedżerze plików.
- 4. Uruchom emulator online OnWorks Linux lub Windows online lub emulator online MACOS z tej witryny.
- 5. W systemie operacyjnym OnWorks Linux, który właśnie uruchomiłeś, przejdź do naszego menedżera plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.
- 6. Pobierz aplikację, zainstaluj ją i uruchom.
ZRZUTY EKRANU
Ad
KORDELAS
OPIS
CUTLASS to zbiór abstrakcji szablonów CUDA C++ do implementacji wysokowydajnego mnożenia macierzy (GEMM) i powiązanych obliczeń na wszystkich poziomach i skalach w CUDA. Zawiera strategie hierarchicznej dekompozycji i przenoszenia danych, podobne do tych używanych do implementacji cuBLAS i cuDNN. CUTLASS rozkłada te „ruchome części” na modułowe komponenty oprogramowania wielokrotnego użytku, wyabstrahowane przez klasy szablonów C++. Te prymitywy obejmujące cały wątek, osnowę, blok i urządzenie można specjalizować i dostrajać za pomocą niestandardowych rozmiarów kafelków, typów danych i innych zasad algorytmicznych. Wynikająca z tego elastyczność upraszcza ich użycie jako bloków konstrukcyjnych w niestandardowych jądrach i aplikacjach. Aby obsługiwać szeroką gamę aplikacji, CUTLASS zapewnia szerokie wsparcie dla obliczeń o mieszanej precyzji, zapewniając wyspecjalizowane abstrakcje ruchu danych i wielokrotnej akumulacji dla zmiennoprzecinkowych półprecyzyjnych (FP16), BFloat16 (BF16), Tensor Float 32 (TF32), itp.
Funkcjonalności
- CUTLASS implementuje wysokowydajny splot poprzez niejawny algorytm GEMM
- Niejawny GEMM to sformułowanie operacji splotu jako GEMM, wykorzystując w ten sposób modułowy potok GEMM CUTLASS
- Twórz sploty, ponownie wykorzystując wysoce zoptymalizowane komponenty GEMM obejmujące całą osnowę i niższe
- Jądra splotu pierwszej warstwy specjalizują się w małych liczbach kanałów i zmniejszonym wyrównaniu
- Operatorzy BLAS3 przyspieszeni przez rdzenie Tensor
- Optymalna wydajność dzięki CUDA 11.7
Język programowania
C + +
Kategorie
Jest to aplikacja, którą można również pobrać z https://sourceforge.net/projects/cutlass.mirror/. Został umieszczony w OnWorks, aby można go było uruchomić online w najprostszy sposób z jednego z naszych bezpłatnych systemów operacyjnych.