GoGPT Best VPN GoSearch

OnWorks-Favicon

ucto – Online in der Cloud

Führen Sie ucto im kostenlosen OnWorks-Hosting-Provider über Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator aus

Dies ist der Befehl ucto, der im kostenlosen OnWorks-Hosting-Provider über eine unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


ucto - Unicode-Tokenizer

ZUSAMMENFASSUNG


ucto [[Optionen]] [Eingabedatei] [[Ausgabedatei]]

BESCHREIBUNG


ukto ucto tokenisiert Textdateien: es trennt Wörter von Satzzeichen, trennt Sätze (und
optional Absätze) und findet gepaarte Anführungszeichen. Ucto ist mit Tokenisierung vorkonfiguriert
Regeln für mehrere Sprachen.

OPTIONAL


-c Konfigurationsdatei
Einstellungen aus einer Datei lesen

-d Wert
Debug-Modus auf 'Wert' setzen

-e Wert
Eingabecodierung einstellen. (Standard-UTF8)

-f
Filterung von Sonderzeichen deaktivieren

-L Sprache
Wählt automatisch eine Konfigurationsdatei nach Sprachcode aus. zB 'fr' wird
wählen Sie die Datei tokconfig-fr aus dem Installationsverzeichnis

-l
In alle Kleinbuchstaben umwandeln

-u
In Großbuchstaben umwandeln

-n
Geben Sie einen Satz pro Zeile bei der Ausgabe aus

-m
Nehmen Sie bei der Eingabe einen Satz pro Zeile an

--durchgehen
Nicht tokenisieren, aber Eingabedecodierung und einfache Token-Rollenerkennung durchführen

-P
Absatzerkennung deaktivieren

-Q
Angebotserkennung aktivieren. (dies ist experimentell und kann zu unerwarteten Ergebnissen führen)

-S
Satzerkennung deaktivieren

-s
Satzende-Markierung setzen. (Standard )

-V
Versionsinformationen anzeigen

-v
Verbose-Modus einstellen

-F
Lesen Sie ein FoLiA-XML-Dokument, tokenisieren Sie es und geben Sie das geänderte Dokument aus. (dies deaktiviert
Verwendung der meisten anderen Optionen: -nulPQvsS)

--textklasse Klasse
Suchen Sie beim Tokenisieren eines FoLiA-XML-Dokuments nach Textknoten der Klasse 'cls'

-X
Ausgabe von FoLiA-XML. (Dies deaktiviert die Verwendung der meisten anderen Optionen: -nulPQvsS)

--Ich würde
Verwenden Sie die angegebene Dokument-ID für die FoLiA-XML

-x (obsolet)
Ausgabe-FoLiA-XML, verwenden Sie die angegebene Dokument-ID. (Dies deaktiviert die Verwendung der meisten anderen
Optionen: -nulPQvsS)

überholt Nutzen Sie -X und --Ich würde beantragen müssen

Nutzen Sie ucto online mit den onworks.net-Diensten


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad




×
Werbung
❤ ️Hier einkaufen, buchen oder kaufen – kostenlos, damit die Dienste kostenlos bleiben.