Questa è l'app per Windows denominata DeepEP, la cui ultima versione può essere scaricata come Stablereleasev1.2.1sourcecode.tar.gz. Può essere eseguita online sul provider di hosting gratuito OnWorks per workstation.
Scarica ed esegui online gratuitamente questa app chiamata DeepEP con OnWorks.
Segui queste istruzioni per eseguire questa app:
- 1. Scaricata questa applicazione sul tuo PC.
- 2. Entra nel nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 3. Carica questa applicazione in tale file manager.
- 4. Avvia qualsiasi emulatore online OS OnWorks da questo sito Web, ma migliore emulatore online Windows.
- 5. Dal sistema operativo OnWorks Windows che hai appena avviato, vai al nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 6. Scarica l'applicazione e installala.
- 7. Scarica Wine dai repository software delle tue distribuzioni Linux. Una volta installato, puoi quindi fare doppio clic sull'app per eseguirli con Wine. Puoi anche provare PlayOnLinux, un'interfaccia fantasiosa su Wine che ti aiuterà a installare programmi e giochi Windows popolari.
Wine è un modo per eseguire il software Windows su Linux, ma senza Windows richiesto. Wine è un livello di compatibilità Windows open source in grado di eseguire programmi Windows direttamente su qualsiasi desktop Linux. Essenzialmente, Wine sta cercando di re-implementare abbastanza Windows da zero in modo che possa eseguire tutte quelle applicazioni Windows senza effettivamente bisogno di Windows.
IMMAGINI:
DeepEP
DESCRIZIONE:
DeepEP è una libreria di comunicazione progettata specificamente per supportare implementazioni Mixture-of-Experts (MoE) e Expert Parallelism (EP). Il suo ruolo principale è implementare kernel di comunicazione GPU all-to-all ad alta velocità e bassa latenza, che gestiscono l'invio di token a diversi expert (o shard) e quindi combinano gli output degli expert nel flusso di dati principale. Poiché le architetture MoE richiedono l'instradamento degli input a diversi expert, il sovraccarico di comunicazione può diventare un collo di bottiglia: DeepEP risolve questo problema fornendo kernel GPU ottimizzati e una logica di dispatch/combining efficiente. La libreria supporta anche operazioni a bassa precisione (come FP8) per ridurre l'utilizzo di memoria e larghezza di banda durante la comunicazione. DeepEP è destinata a sistemi di inferenza o addestramento di modelli su larga scala in cui il parallelismo degli expert viene utilizzato per scalare la capacità del modello senza replicare intere reti.
Caratteristiche
- Kernel di comunicazione GPU all-to-all ottimizzati per la distribuzione e la combinazione MoE
- Su misura per architetture di parallelismo esperto (EP) per la scalabilità della capacità del modello
- Supporto per operazioni a bassa precisione (ad esempio FP8) per ridurre memoria/larghezza di banda
- Progettazione ad alta produttività e bassa latenza (riducendo al minimo il sovraccarico di comunicazione)
- Potenziale di integrazione con stack di modelli MoE per gestire in modo efficiente il routing degli esperti
- Concentrarsi sull'utilizzo su scala di produzione: consentire un'inferenza/formazione più rapida nei sistemi MoE
Linguaggio di programmazione
Python
Categorie
Questa applicazione può essere scaricata anche da https://sourceforge.net/projects/deepep.mirror/. È ospitata su OnWorks per poter essere eseguita online nel modo più semplice da uno dei nostri sistemi operativi gratuiti.