Amazon Best VPN GoSearch

Ulubiona usługa OnWorks

Pobierz CUTLASS dla systemu Linux

Bezpłatne pobieranie aplikacji CUTLASS Linux do uruchamiania online w Ubuntu online, Fedora online lub Debian online

To aplikacja dla systemu Linux o nazwie CUTLASS, której najnowszą wersję można pobrać jako CUTLASS4.1.0sourcecode.tar.gz. Można ją uruchomić online na bezpłatnym hostingu OnWorks dla stacji roboczych.

Pobierz i uruchom online tę aplikację o nazwie CUTLASS z OnWorks za darmo.

Postępuj zgodnie z tymi instrukcjami, aby uruchomić tę aplikację:

- 1. Pobrałem tę aplikację na swój komputer.

- 2. Wpisz w naszym menedżerze plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.

- 3. Prześlij tę aplikację w takim menedżerze plików.

- 4. Uruchom emulator online OnWorks Linux lub Windows online lub emulator online MACOS z tej witryny.

- 5. W systemie operacyjnym OnWorks Linux, który właśnie uruchomiłeś, przejdź do naszego menedżera plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.

- 6. Pobierz aplikację, zainstaluj ją i uruchom.

ZRZUTY EKRANU

Ad


KORDELAS


OPIS

CUTLASS to zbiór abstrakcji szablonów CUDA C++ do implementacji wysokowydajnego mnożenia macierzy (GEMM) i powiązanych obliczeń na wszystkich poziomach i skalach w CUDA. Zawiera strategie hierarchicznej dekompozycji i przenoszenia danych, podobne do tych używanych do implementacji cuBLAS i cuDNN. CUTLASS rozkłada te „ruchome części” na modułowe komponenty oprogramowania wielokrotnego użytku, wyabstrahowane przez klasy szablonów C++. Te prymitywy obejmujące cały wątek, osnowę, blok i urządzenie można specjalizować i dostrajać za pomocą niestandardowych rozmiarów kafelków, typów danych i innych zasad algorytmicznych. Wynikająca z tego elastyczność upraszcza ich użycie jako bloków konstrukcyjnych w niestandardowych jądrach i aplikacjach. Aby obsługiwać szeroką gamę aplikacji, CUTLASS zapewnia szerokie wsparcie dla obliczeń o mieszanej precyzji, zapewniając wyspecjalizowane abstrakcje ruchu danych i wielokrotnej akumulacji dla zmiennoprzecinkowych półprecyzyjnych (FP16), BFloat16 (BF16), Tensor Float 32 (TF32), itp.



Funkcjonalności

  • CUTLASS implementuje wysokowydajny splot poprzez niejawny algorytm GEMM
  • Niejawny GEMM to sformułowanie operacji splotu jako GEMM, wykorzystując w ten sposób modułowy potok GEMM CUTLASS
  • Twórz sploty, ponownie wykorzystując wysoce zoptymalizowane komponenty GEMM obejmujące całą osnowę i niższe
  • Jądra splotu pierwszej warstwy specjalizują się w małych liczbach kanałów i zmniejszonym wyrównaniu
  • Operatorzy BLAS3 przyspieszeni przez rdzenie Tensor
  • Optymalna wydajność dzięki CUDA 11.7


Język programowania

C + +


Kategorie

Matematyka, uczenie maszynowe

Jest to aplikacja, którą można również pobrać z https://sourceforge.net/projects/cutlass.mirror/. Został umieszczony w OnWorks, aby można go było uruchomić online w najprostszy sposób z jednego z naszych bezpłatnych systemów operacyjnych.


Darmowe serwery i stacje robocze

Pobierz aplikacje Windows i Linux

Komendy systemu Linux

Ad




×
reklama
❤️Zrób zakupy, zarezerwuj lub kup tutaj — bezpłatnie, co pomaga utrzymać bezpłatne usługi.