EnglischFranzösischSpanisch

Ad


OnWorks-Favicon

langidentp – Online in der Cloud

Führen Sie langidentp im kostenlosen Hosting-Anbieter OnWorks über Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator aus

Dies ist der Befehl langidentp, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


langident – ​​identifiziert die Sprachdateien, in die geschrieben wird

ZUSAMMENFASSUNG


langident [OPTIONEN] Datei1 [Datei2 ...]

BESCHREIBUNG


Identifiziert die Sprachdateien, in die mithilfe des Perl-Moduls Lingua::Identify geschrieben wird.

OPTIONAL
-a
Alle Ergebnisse anzeigen (nicht nur die wahrscheinlichste Sprache).

-c
Konfidenzniveau für die wahrscheinlichste Sprache anzeigen (dies ist der erste Wert direkt danach).
die wahrscheinlichste Sprache).

-d
Debug (nur Entwicklung).

-E CODIERUNG
Wählen Sie eine Eingabekodierung aus. Standardmäßig ist UTF-8.

# ISO-8859-1 (lateinisch1) verwenden
langident -E ISO-8859-1-Datei

-e METHODEN
Wählen Sie die zu verwendende(n) Methode(n) aus. Dafür gibt es drei Möglichkeiten:

# einfach eine Methode verwenden
langident -e ngrams3-Datei

# mehrere Methoden verwenden (durch Komma trennen)
langident -e Präfixe3,Suffixe3

# Verwenden Sie mehrere Methoden und weisen Sie jeder davon unterschiedliche Gewichte zu
langident -e smallwords=2,prefixes=1,ngrams3=1.3

Die verfügbaren Methoden sind die folgenden: Kleinwörter, Präfixe1, Präfixe2, Präfixe3,
Präfixe4, Suffixe1, Suffixe2, Suffixe3, Suffixe4, ngrams1, ngrams2, ngrams3 und
ngrams4.

-h
Hilfemeldung anzeigen und beenden.

-l
Alle verfügbaren Sprachen auflisten und beenden.

-m NUMBER
Legen Sie die maximale Anzahl der anzuzeigenden Ergebnisse (Sprachen) fest (zeigt die N wahrscheinlichsten Sprachen an,
nach absteigender Wahrscheinlichkeit).

Überschreibt den Schalter -a.

-o SPRACHEN
Arbeiten Sie nur mit den angegebenen Sprachen.

# Nur zwischen Portugiesisch und Englisch unterscheiden
langident -o pt,en *

-p
Zeigen Sie auch Prozentsätze an.

-s GRÖßE
Maximale zu untersuchende Größe.

-v
Version anzeigen und beenden.

Beispiele:


Verwenden Sie die Methoden ngrams2 und ngrams1 und weisen Sie ngrams2 das Doppelte der Wichtigkeit zu (-e
schalten); Die Ausgabe enthält die drei wahrscheinlichsten Sprachen (Schalter -m).
Prozentsätze (Schalter -p) und auch das Konfidenzniveau (Schalter -c) des ersten Ergebnisses.

$ langident -e ngrams2=2,ngrams1 -c -p -m 3 README
README:en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$

TO DO


· Fügen Sie einen Schalter hinzu, um HTML-Tags (und möglicherweise auch andere Formate) zu ignorieren.

Nutzen Sie langidentp online über die Dienste von onworks.net


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad