Aceasta este comanda langidentp care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS
PROGRAM:
NUME
langident - identifică limba în care sunt scrise fișierele
REZUMAT
langident [OPȚIUNI] fișier1 [fișier2 ...]
DESCRIERE
Identifică fișierele de limbă în care sunt scrise folosind modulul Perl Lingua::Identify.
OPŢIUNI
-a
Afișați toate rezultatele (nu doar limba cea mai probabilă).
-c
Arată nivelul de încredere pentru limbajul cel mai probabil (va fi prima valoare imediat după
limba cea mai probabilă).
-d
Depanare (numai pentru dezvoltare).
-E CODIFICARE
Selectați o codificare de intrare. Implicit la UTF-8.
# utilizați ISO-8859-1 (latin1)
langident -E fișier ISO-8859-1
-e METODE
Selectați metoda(ele) de utilizat. Există trei moduri de a face acest lucru:
# folosind pur și simplu o metodă
langident -e ngrams3 fișier
# folosind mai multe metode (separați-le cu virgulă)
langident -e prefixe3,sufixe3
# folosind mai multe metode și atribuiți ponderi diferite fiecăruia dintre ele
langident -e smallwords=2,prefixes=1,ngrams3=1.3
Metodele disponibile sunt următoarele: cuvinte mici, prefixe1, prefixe2, prefixe3,
prefixe4, sufixe1, sufixe2, sufixe3, sufixe4, ngrame1, ngrame2, ngrame3 și
ngrame4.
-h
Afișați mesajul de ajutor și ieșiți.
-l
Listați toate limbile disponibile și ieșiți.
-m NUMĂR
Setați numărul maxim de rezultate (limbi) de afișat (afișează cele mai probabile N limbi,
în ordinea descrescătoare a probabilităţii).
Ignoră comutatorul -a.
-o LIMBI
Funcționează numai cu limbi specificate.
# identificați numai între portugheză și engleză
langident -o pt,en *
-p
Arată și procente.
-s MĂRIMEA
Dimensiunea maximă de examinat.
-v
Afișați versiunea și ieșiți.
EXEMPLE
Folosiți metodele ngrams2 și ngrams1, atribuind dublul de importanță ngrams2 (-e
intrerupator); ieșirea va include cele mai probabile trei limbi (-m switch) cu sale
procente (-p switch) și, de asemenea, nivelul de încredere (-c switch) al primului rezultat.
$ langident -e ngrams2=2,ngrams1 -c -p -m 3 README
CITEȘTE-MĂ:en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$
LA DO
· Adăugați un comutator pentru a ignora etichetele HTML (și poate și alte formate)
Utilizați langidentp online folosind serviciile onworks.net