Aceasta este aplicația Linux numită UnsupervisedMT, a cărei ultimă versiune poate fi descărcată sub numele UnsupervisedMTsourcecode.tar.gz. Poate fi rulată online în furnizorul de găzduire gratuită OnWorks pentru stații de lucru.
Descărcați și rulați online gratuit această aplicație numită UnsupervisedMT cu OnWorks.
Urmați aceste instrucțiuni pentru a rula această aplicație:
- 1. Ați descărcat această aplicație pe computer.
- 2. Introduceți în managerul nostru de fișiere https://www.onworks.net/myfiles.php?username=XXXXX cu numele de utilizator pe care îl doriți.
- 3. Încărcați această aplicație într-un astfel de manager de fișiere.
- 4. Porniți emulatorul online OnWorks Linux sau Windows online sau emulatorul online MACOS de pe acest site web.
- 5. Din sistemul de operare OnWorks Linux pe care tocmai l-ați pornit, accesați managerul nostru de fișiere https://www.onworks.net/myfiles.php?username=XXXXX cu numele de utilizator dorit.
- 6. Descărcați aplicația, instalați-o și rulați-o.
CAPTURĂ DE ECRAN:
MT nesupravegheat
DESCRIERE:
Traducerea automată nesupervizată este un depozit de cercetare care implementează atât abordări SMT bazate pe fraze, cât și abordări MT neuronale pentru traducere fără corpora paralelă. Componenta neuronală acceptă arhitecturi multiple - seq2seq, biLSTM cu atenție și Transformer - și permite partajarea extinsă a parametrilor între limbi pentru a îmbunătăți eficiența datelor. Antrenamentul se bazează pe eliminarea zgomotului din auto-codificare și traducere inversă, cu generare multi-threaded în mișcare de date paralele sintetice pentru a reîmprospăta continuu semnalele de supervizare. Proiectul oferă, de asemenea, scripturi pentru a prelua și preprocesa date monolingve, a învăța coduri BPE și a antrena încorporări interlingve care bootează alinierea nesupervizată între limbi. Dincolo de configurația de bază EMNLP 2018, baza de cod expune capabilități suplimentare, opționale, cum ar fi antrenamentul multilingv, pre-antrenamentul modelului lingvistic cu parametri partajați și antrenamentul adversarial.
Categorii
- TA neuronală cu arhitecturi seq2seq, biLSTM+attention și Transformer
- Partajarea parametrilor între codificatoare/decodificatoare și încorporări pentru mai multe limbi
- Eliminarea zgomotului prin antrenamentul auto-encoderului și traducerea inversă cu generare din mers
- Utilitare pentru descărcarea, tokenizarea, BPE-ul și binarizarea unor corporauri monolingve mari
- Integrare interlingvistică prin metode fastText sau de aliniere pentru inițializarea modelelor
- Canal de lucru PBSMT nesupravegheat cu instruire și evaluare automată a lui Moses
Limbaj de programare
Python, Unix Shell
Categorii
Aceasta este o aplicație care poate fi descărcată și de la https://sourceforge.net/projects/unsupervisedmt.mirror/. A fost găzduită în OnWorks pentru a putea fi rulată online în cel mai simplu mod de pe unul dintre sistemele noastre de operare gratuite.