Dies ist der Befehl langidentp, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
langident – identifiziert die Sprachdateien, in die geschrieben wird
ZUSAMMENFASSUNG
langident [OPTIONEN] Datei1 [Datei2 ...]
BESCHREIBUNG
Identifiziert die Sprachdateien, in die mithilfe des Perl-Moduls Lingua::Identify geschrieben wird.
OPTIONAL
-a
Alle Ergebnisse anzeigen (nicht nur die wahrscheinlichste Sprache).
-c
Konfidenzniveau für die wahrscheinlichste Sprache anzeigen (dies ist der erste Wert direkt danach).
die wahrscheinlichste Sprache).
-d
Debug (nur Entwicklung).
-E CODIERUNG
Wählen Sie eine Eingabekodierung aus. Standardmäßig ist UTF-8.
# ISO-8859-1 (lateinisch1) verwenden
langident -E ISO-8859-1-Datei
-e METHODEN
Wählen Sie die zu verwendende(n) Methode(n) aus. Dafür gibt es drei Möglichkeiten:
# einfach eine Methode verwenden
langident -e ngrams3-Datei
# mehrere Methoden verwenden (durch Komma trennen)
langident -e Präfixe3,Suffixe3
# Verwenden Sie mehrere Methoden und weisen Sie jeder davon unterschiedliche Gewichte zu
langident -e smallwords=2,prefixes=1,ngrams3=1.3
Die verfügbaren Methoden sind die folgenden: Kleinwörter, Präfixe1, Präfixe2, Präfixe3,
Präfixe4, Suffixe1, Suffixe2, Suffixe3, Suffixe4, ngrams1, ngrams2, ngrams3 und
ngrams4.
-h
Hilfemeldung anzeigen und beenden.
-l
Alle verfügbaren Sprachen auflisten und beenden.
-m NUMBER
Legen Sie die maximale Anzahl der anzuzeigenden Ergebnisse (Sprachen) fest (zeigt die N wahrscheinlichsten Sprachen an,
nach absteigender Wahrscheinlichkeit).
Überschreibt den Schalter -a.
-o SPRACHEN
Arbeiten Sie nur mit den angegebenen Sprachen.
# Nur zwischen Portugiesisch und Englisch unterscheiden
langident -o pt,en *
-p
Zeigen Sie auch Prozentsätze an.
-s GRÖßE
Maximale zu untersuchende Größe.
-v
Version anzeigen und beenden.
Beispiele:
Verwenden Sie die Methoden ngrams2 und ngrams1 und weisen Sie ngrams2 das Doppelte der Wichtigkeit zu (-e
schalten); Die Ausgabe enthält die drei wahrscheinlichsten Sprachen (Schalter -m).
Prozentsätze (Schalter -p) und auch das Konfidenzniveau (Schalter -c) des ersten Ergebnisses.
$ langident -e ngrams2=2,ngrams1 -c -p -m 3 README
README:en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$
TO DO
· Fügen Sie einen Schalter hinzu, um HTML-Tags (und möglicherweise auch andere Formate) zu ignorieren.
Nutzen Sie langidentp online über die Dienste von onworks.net