Dies ist der Befehl ucto, der im kostenlosen OnWorks-Hosting-Provider über eine unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
ucto - Unicode-Tokenizer
ZUSAMMENFASSUNG
ucto [[Optionen]] [Eingabedatei] [[Ausgabedatei]]
BESCHREIBUNG
ukto ucto tokenisiert Textdateien: es trennt Wörter von Satzzeichen, trennt Sätze (und
optional Absätze) und findet gepaarte Anführungszeichen. Ucto ist mit Tokenisierung vorkonfiguriert
Regeln für mehrere Sprachen.
OPTIONAL
-c Konfigurationsdatei
Einstellungen aus einer Datei lesen
-d Wert
Debug-Modus auf 'Wert' setzen
-e Wert
Eingabecodierung einstellen. (Standard-UTF8)
-f
Filterung von Sonderzeichen deaktivieren
-L Sprache
Wählt automatisch eine Konfigurationsdatei nach Sprachcode aus. zB 'fr' wird
wählen Sie die Datei tokconfig-fr aus dem Installationsverzeichnis
-l
In alle Kleinbuchstaben umwandeln
-u
In Großbuchstaben umwandeln
-n
Geben Sie einen Satz pro Zeile bei der Ausgabe aus
-m
Nehmen Sie bei der Eingabe einen Satz pro Zeile an
--durchgehen
Nicht tokenisieren, aber Eingabedecodierung und einfache Token-Rollenerkennung durchführen
-P
Absatzerkennung deaktivieren
-Q
Angebotserkennung aktivieren. (dies ist experimentell und kann zu unerwarteten Ergebnissen führen)
-S
Satzerkennung deaktivieren
-s
Satzende-Markierung setzen. (Standard )
-V
Versionsinformationen anzeigen
-v
Verbose-Modus einstellen
-F
Lesen Sie ein FoLiA-XML-Dokument, tokenisieren Sie es und geben Sie das geänderte Dokument aus. (dies deaktiviert
Verwendung der meisten anderen Optionen: -nulPQvsS)
--textklasse Klasse
Suchen Sie beim Tokenisieren eines FoLiA-XML-Dokuments nach Textknoten der Klasse 'cls'
-X
Ausgabe von FoLiA-XML. (Dies deaktiviert die Verwendung der meisten anderen Optionen: -nulPQvsS)
--Ich würde
Verwenden Sie die angegebene Dokument-ID für die FoLiA-XML
-x (obsolet)
Ausgabe-FoLiA-XML, verwenden Sie die angegebene Dokument-ID. (Dies deaktiviert die Verwendung der meisten anderen
Optionen: -nulPQvsS)
überholt Nutzen Sie -X und --Ich würde beantragen müssen
Nutzen Sie ucto online mit den onworks.net-Diensten
