Aceasta este aplicația Linux numită Cross-Language Computational Linguistics, care rulează online în Linux, a cărei cea mai recentă versiune poate fi descărcată ca arwiki-20150311-pages-articles.txt.7z. Poate fi rulat online în furnizorul de găzduire gratuit OnWorks pentru stații de lucru.
Descărcați și rulați online această aplicație numită Cross-Language Computational Linguistics pentru a rula gratuit în Linux online cu OnWorks.
Urmați aceste instrucțiuni pentru a rula această aplicație:
- 1. Ați descărcat această aplicație pe computer.
- 2. Introduceți în managerul nostru de fișiere https://www.onworks.net/myfiles.php?username=XXXXX cu numele de utilizator pe care îl doriți.
- 3. Încărcați această aplicație într-un astfel de manager de fișiere.
- 4. Porniți emulatorul online OnWorks Linux sau Windows online sau emulatorul online MACOS de pe acest site web.
- 5. Din sistemul de operare OnWorks Linux pe care tocmai l-ați pornit, accesați managerul nostru de fișiere https://www.onworks.net/myfiles.php?username=XXXXX cu numele de utilizator dorit.
- 6. Descărcați aplicația, instalați-o și rulați-o.
Lingvistică computațională în mai multe limbi pentru a rula online în Linux
Ad
DESCRIERE
Corpusul AFEWC este un articol de text comparabil multilingv în limbile arabă, franceză și engleză. Fiecare articol triplu este legat de același subiect (aliniat la nivel de articol). Corpusul AFEWC este colectat de pe Wikipedia. Corpusul este disponibil gratuit numai în scopuri de cercetare. Este compus din 40 de articole aliniate, 91.3M de cuvinte englezești, 57.8M de cuvinte franceze, 22M de cuvinte arabe, 2.8M de cuvinte unice în limba engleză, 1.9M de cuvinte unice de franceză și 1.5M de cuvinte unice de arabă.Textul Wikipedia este disponibil sub licența Creative Commons Attribution-ShareAlike 3.0. https://en.wikipedia.org/wiki/Wikipedia:About
Pentru a cita corpurile:
M. Saad, D. Langlois și K. Smaïli. Extragerea articolelor comparabile din Wikipedia și măsurarea comparabilităților acestora. Procedia - Științe Sociale și Comportamentale, 95(0):40 – 47, 2013. ISSN 1877-0428.
Interfața cu utilizatorul
Non-interactiv (Daemon)
Aceasta este o aplicație care poate fi preluată și de la https://sourceforge.net/projects/crlcl/. A fost găzduit în OnWorks pentru a fi rulat online într-un mod cât mai ușor de pe unul dintre sistemele noastre operative gratuite.