Dit is de opdracht langidentp die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online-emulator of MAC OS online-emulator
PROGRAMMA:
NAAM
langident - identificeert de taal waarin bestanden zijn geschreven
KORTE INHOUD
langident [OPTIES] bestand1 [bestand2 ...]
PRODUCTBESCHRIJVING
Identificeert de taalbestanden waarin de Perl-module Lingua::Identify is gebruikt.
OPTIES
-a
Toon alle resultaten (niet alleen de meest waarschijnlijke taal).
-c
Toon het betrouwbaarheidsniveau voor de meest waarschijnlijke taal (dit is de eerste waarde direct daarna
de meest waarschijnlijke taal).
-d
Foutopsporing (alleen ontwikkeling).
-E CODERING
Selecteer een invoercodering. Standaard ingesteld op UTF-8.
# gebruik ISO-8859-1 (latin1)
langident -E ISO-8859-1 bestand
-e METHODEN
Selecteer de te gebruiken methode(n). Er zijn drie manieren om dit te doen:
# gewoon een methode gebruiken
langident -e ngrams3 bestand
# verschillende methoden gebruiken (scheid ze met een komma)
langident -e voorvoegsels3, achtervoegsels3
# verschillende methoden gebruiken en aan elk daarvan een ander gewicht toekennen
langident -e kleine woorden=2,voorvoegsels=1,ngrams3=1.3
De beschikbare methoden zijn de volgende: kleine woorden, voorvoegsels1, voorvoegsels2, voorvoegsels3,
voorvoegsels4, achtervoegsels1, achtervoegsels2, achtervoegsels3, achtervoegsels4, ngrammen1, ngrammen2, ngrammen3 en
ngrammen4.
-h
Help-bericht weergeven en afsluiten.
-l
Maak een lijst van alle beschikbare talen en sluit af.
-m NUMMER
Stel maximum aantal resultaten (talen) in om weer te geven (toont de N meest waarschijnlijke talen,
in afnemende volgorde van waarschijnlijkheid).
Negeert de schakeloptie -a.
-o TALEN
Werk alleen met gespecificeerde talen.
# identificeer alleen tussen Portugees en Engels
langident -o pt,en *
-p
Laat ook percentages zien.
-s SIZE
Maximale grootte om te onderzoeken.
-v
Toon versie en sluit af.
Voorbeelden
Gebruik de methoden ngrams2 en ngrams1, waarbij u het dubbele van belang toekent aan ngrams2 (-bijv
schakelaar); uitvoer bevat de drie meest waarschijnlijke talen (-m switch) met zijn
percentages (-p switch) en ook het betrouwbaarheidsniveau (-c switch) van het eerste resultaat.
$ langident -e ngrams2=2,ngrams1 -c -p -m 3 LEESMIJ
LEESMIJ:en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$
TO DO
· Voeg een schakelaar toe om HTML-tags te negeren (en misschien ook andere indelingen)
Gebruik langidentp online met behulp van onworks.net-services