EnglischFranzösischSpanisch

Ad


OnWorks-Favicon

dictfmt - Online in der Cloud

Führen Sie dictfmt im kostenlosen OnWorks-Hosting-Anbieter über Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator aus

Dies ist der Befehl dictfmt, der im kostenlosen OnWorks-Hosting-Provider mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


dictfmt - formatiert eine DICT-Protokoll-Wörterbuchdatenbank

ZUSAMMENFASSUNG


dictfmt -c5|-t|-e|-f|-h|-j|-p [Optionen] Basisname
dictfmt -i|-ich [Optionen]

BESCHREIBUNG


dictfmt nimmt eine Datei, DATEI, auf stdin und erstellt eine Wörterbuchdatenbank namens
Basisname.dict, die dem DICT-Protokoll entspricht. Es erstellt auch eine Indexdatei namens
basisname.index. Standardmäßig wird der Index nach dem C-Gebietsschema sortiert, und nur
Beim Sortieren werden alphanumerische Zeichen und Leerzeichen verwendet, dies kann jedoch mit geändert werden
die Optionen --locale und --allchars. ( Basisname wird üblicherweise so gewählt, dass sie dem entspricht
Basisname von FILE , aber das ist nicht zwingend.)

Sofern die Datenbank nicht sehr klein ist, wird dringend empfohlen, dass Basisname.dict be
komprimiert mit /usr/bin/dictzip erschaffen basisname.dict.dz. (dictzip ist im Lieferumfang enthalten)
dikt Quellpaket.)

DATEI kann in einem der verschiedenen Formate vorliegen, die durch die Formatoptionen -c5, -t, -e, -f,
-h, -j, -p, -i oder -I. Genau eine dieser Optionen muss angegeben werden.

dictfmt stellt der .dict-Datei mehrere Header voran. Der 00-Datenbank-URL-Header gibt
der Wert der Option -u als URL der Site, von der die ursprüngliche Datenbank stammt
erhalten. Der 00-database-short-Header gibt den Wert der Option -s als Kurznamen an
des Wörterbuches. (Dieser "Kurzname" ist der identifizierende Name, der vom "dict-D" gegeben wird.
Option.) Wenn die Optionen -u und/oder -s weggelassen werden, werden diese Werte als
"unbekannt", was für eine öffentlich verteilte Datenbank unerwünscht ist.

Das Datum der Konvertierung (Formatierung) wird im Header 00-database-info angegeben. Alle Texte in
die Eingabedatei vor dem ersten Stichwort (wie durch die entsprechende Formatierung definiert)
Option) wird an diesen Header angehängt. Der gesamte Text in der Eingabedatei nach einem Stichwort, nach oben
zum nächsten Stichwort, wird unverändert in die .dict-Datei kopiert.

FORMATIERUNG OPTIONAL


-c5 FILE ist formatiert mit Stichworte mit vorangestellten 5 oder mehr Unterstrichen (_)
und eine Leerzeile. Alle Texte bis zum nächsten Stichwort gilt als Definition.
Alle führenden `@'-Zeichen werden entfernt, aber die Datei bleibt ansonsten unverändert.
Diese Option wurde geschrieben, um das CIA WORLD FACTBOOK 1995 zu formatieren.

-t -c5, --Without-info und --Without-Headword-Optionen sind impliziert. Verwenden Sie diese Option,
wenn eine Eingabedatenbank stammt von dictunformat Dienstprogramm.

-e FILE ist im HTML-Format, mit dem Stichwort als fett markiert. ( Stichwort - )
Diese Option wurde geschrieben, um EASTON'S 1897 BIBELWÖRTERBUCH zu formatieren. Ein typischer Eintrag
von Easton ist:


Abagtha -
einer der sieben Eunuchen im Hof ​​des Ahasverus (Esther 1:10; 2:21).

Dies wird umgewandelt in:
Abagta
einer der sieben Eunuchen im Hof ​​des Ahasverus (Esther 1:10; 2:21).

Die Überschrift " wird weggelassen, und die Stichwort `Abagtha' ist indiziert.

Anmerkungen: Diese Option sollte mit Vorsicht verwendet werden. Es entfernt mehrere HTML-Tags
(genug, um Easton richtig zu formatieren), aber nicht alle. Das Makefile, das ursprünglich war
geschrieben im Format dict-easton verwendet sed-Skripte, um bestimmte Querverweise zu ändern
Stichworte. Es kann erforderlich sein, die Eingabedatei durch ein sed-Skript zu leiten oder die Datei zu hacken
Quelle von dictfmt, um andere HTML-Datenbanken richtig zu formatieren.

-f FILE ist formatiert mit dem Stichworte beginnend in Spalte 0, mit der Definition
mindestens ein Leerzeichen (oder Tabulatorzeichen) in nachfolgenden Zeilen eingerückt. Das dritte Linie
beginnend in Überblick 0 is gemacht as zuerst Stichwort , und die ersten beiden Zeilen
beginnend in Spalte 0 werden als Teil des 00-database-info-Headers behandelt. Dies
Option wurde geschrieben, um das FOLDOC zu formatieren

-h FILE ist formatiert mit dem Stichworte beginnend in Spalte 0, gefolgt von einem Komma,
wobei die Definition in derselben Zeile fortgesetzt wird. Alle Texte vor der ersten Single
Zeichenzeile ist in der Kopfzeile 00-database-info enthalten, und Zeilen mit nur einer
Zeichen werden in der .dict-Datei weggelassen. Das zuerst Stichwort is on Linie
Folgende zuerst Single Charakter Linie. Das Stichwort ist indiziert; der Text von
die Datei wird nicht geändert. Diese Option wurde geschrieben, um HITCHCOCK'S BIBELNAMEN zu formatieren
WÖRTERBUCH.

-j FILE ist formatiert mit Stichworte beginnend in Spalte 0, eingeschlossen in Doppelpunkte, gefolgt von
die Definition. Die Doppelpunkte um die Stichwort entfernt werden, und die Stichwort
ist indiziert. Zeilen, die mit '*', '=' oder '-' beginnen, werden ebenfalls entfernt. Alle Texte
bevor das erste Stichwort in die Kopfzeilen aufgenommen wird. Diese Option wurde geschrieben an
formatieren Sie die JARGON-DATEI.
Anmerkungen: Einige neuere Versionen der JARGON-DATEI enthielten drei Leerzeichen vor dem
erster Doppelpunkt bei jedem Stichwort. Diese müssen vor der Verarbeitung mit . entfernt werden
diktfmt. (Zu diesem Zweck wurden sed-Skripte verwendet. ed-, awk- oder perl-Skripte
sind auch möglich.)

-p FILE wird mit `%h' in Spalte 0 formatiert, gefolgt von einem Leerzeichen, gefolgt von dem
Stichwort, optional gefolgt von einer Zeile mit `%d' in Spalte 0. Die
Definition beginnt in der folgenden Zeile. Die erste Zeile beginnt mit ´%h´ und alle
Zeilen, die mit '%d' beginnen, werden aus der .dict-Datei entfernt, und '%h' wird aus entfernt
vor dem Stichwort. Der gesamte Text vor dem ersten Stichwort ist im enthalten
Überschriften. Das zweite Linie Anfang '%h' is gemacht as zuerst Stichwort.
Diese Option wurde geschrieben, um die Elementdatenbank von Jay Kominek zu formatieren.

-i -I Diese beiden Optionen unterscheiden sich von allen anderen Formatierungsoptionen. Sie sind
beabsichtigt, zurückzugreifen (gemäß dikt Anforderung) eine .index-Datei, die auf stdin angegeben ist.
Das heißt, die .dict-Datei wird überhaupt nicht generiert. Es wird nur umsortiert. Drei- oder
Es wird eine vierspaltige .indexähnliche Eingabe erwartet. -i erwartet Dezimaloffset und Länge,
während -I erwartet sie im base64-Format.

OPTIONAL


-u URL Gibt die URL der Site an, von der die Rohdatenbank abgerufen wurde. Wenn das
Option angegeben, 00-Datenbank-URL-Schlüsselwort und entsprechende Definition werden
ignoriert.

-s Name
Gibt den Namen und optional die Version und das Datum der Datenbank an. (Wenn
dies enthält Leerzeichen, es muss in Anführungszeichen gesetzt werden.) Wenn diese Option angegeben ist,
00-Datenbank-Kurzwort und entsprechende Definition werden ignoriert.

-L Lizenz- und Copyright-Informationen anzeigen

-V Versionsinformationen anzeigen

-D Debugging-Informationen ausgeben

--help eine Hilfemeldung anzeigen

- Gebietsschema lokal
Gibt das zum Sortieren verwendete Gebietsschema an. Wenn kein Gebietsschema angegeben ist, wird das Gebietsschema "C"
wird genutzt. Um den UTF-8-Modus zu verwenden, wird --utf8 benötigt.

--8 Bit generiert Datenbank im 8-Bit-Modus, siehe - Gebietsschema Option auch.
Hinweis: Diese Option ist veraltet. Verwenden Sie es zum Erstellen von 8-Bit (Nicht-UTF8)-Wörterbüchern
nur. Um ein UTF-8-Wörterbuch zu erstellen, verwenden Sie --utf8 Option statt.

--utf8 Falls angegeben, wird die UTF-8-Datenbank erstellt.

--allchars
Gibt an, dass standardmäßig nur alle Zeichen für die Suche verwendet werden sollen
alphabetische, numerische Zeichen und Leerzeichen werden in die .index-Datei eingefügt und sind daher
in der Suche verwendet. Erzeugt den speziellen Eintrag 00-database-allchars.

--Groß-/Kleinschreibung beachten
macht die Suche zwischen Groß- und Kleinschreibung. Erzeugt den speziellen Eintrag 00-Datenbank-Fall-
empfindlich.

--Stichwort-Trennzeichen Sept
setzt das Stichwort-Trennzeichen, wodurch mehrere Wörter gleich sein können
Definition. Wenn beispielsweise ´--headword-separator %%%' angegeben ist und die Eingabe
Datei enthält ´autumn%%%fall', sowohl 'autumn' als auch 'fall' werden indiziert als
Stichworte, mit der gleichen Definition.

--index-data-separator Sept
setzt das Index-/Datentrennzeichen, mit dem man die erste und vierte Spalte einstellen kann
der .index-Datei unabhängig. Das ist die erste Spalte kann als Index behandelt werden
Spalte (wo der MATCH-Befehl sucht) und die vierte Spalte als Ergebnisspalte
(wo das MATCH Dinge zurückgibt), und sie (1. und 4. Spalte) sind
völlig unabhängig voneinander. Der Standardwert für dieses Trennzeichen ist
ASCII-Symbol " \034".

--break-headwords
mehrere Stichwörter werden in separate Zeilen in die .dict-Datei geschrieben. Für den Einsatz
mit '--Stichwort-Trennzeichen.

--index-keep-orig
Wenn --utf-8 angegeben wird, sind die Schlüsselwörter Kleinbuchstaben und nicht alphanumerische Zeichen
werden vor dem Speichern in der .index-Datei daraus entfernt, um die Suche zu vereinfachen.
Wenn die Option --index-keep-orig verwendet wird, wird die vierte Spalte erstellt (falls erforderlich) in
.index-Datei und enthält ein ursprüngliches Stichwort, das vom MATCH-Befehl zurückgegeben wird.
Diese Option kann nützlich sein, um die Konvertierung von "AT&T" in "ATT" zu verhindern oder um die korrekte Einstellung zu gewährleisten
Nomen mit großgeschriebenem Anfangsbuchstaben.

--ohne-Stichwort
Stichwörter werden nicht in die .dict-Datei aufgenommen

--ohne-Header
Header wird nicht in DB-Info-Eintrag kopiert

--ohne-URL
URL wird nicht in DB-Info-Eintrag kopiert

--ohne-Zeit
Zeitpunkt der Erstellung wird nicht in DB-Info-Eintrag kopiert

--ohne-ver
Standardmäßig dictfmt erstellt einen speziellen Eintrag 00-database-dictfmt-XYZ, der . enthält
(in .dict-Datei) dictfmt-Version im Format dictfmt-XYZ Diese Option unterdrückt
Dies.

--ohne-Info
DB-Info-Eintrag wird nicht erstellt. Dies kann nützlich sein, wenn 00-Datenbank-Info-Stichwort
wird von stdin erwartet (dictunformat gibt es aus).

--Säulen Spalten
Standardmäßig dictfmt umschließt Zeichenfolgen, die von stdin gelesen werden, in 72 Spalten. Diese Option
ändert diese Vorgabe. Wenn es auf null oder einen negativen Wert gesetzt ist, ist die Umbruchfunktion deaktiviert.

--default-strategie Strategie
Legt die Standardsuchstrategie für die Datenbank fest. Es wird anstelle von verwendet
Strategie '.'. Sondereintrag 00-Datenbank-Standardstrategie ist dafür geschaffen
Zweck. Diese Option kann beispielsweise für Wörterbücher nützlich sein, die
hauptsächlich Phrasen, aber die einzelnen Wörter. Verwenden Sie diese Option auf jeden Fall, wenn Sie
absolut sicher was du tust.

--mime-header mime_header
Wenn der Kunde sendet zur Auswahl MIME Befehl an die dikt , Definitionen darin gefunden
Datenbank wird der angegebene MIME-Header vorangestellt. Erstellt den Sondereintrag
00-Datenbank-Mime-Header.

CREDITS


dictfmt wurde geschrieben von Rik Faith ([E-Mail geschützt] ) als Teil des dict-misc-Pakets.
dictfmt wird unter den Bedingungen der GNU General Public License vertrieben. Wenn du musst
unter anderen Bedingungen verteilen, an den Autor schreiben.

Verwenden Sie dictfmt online mit den onworks.net-Diensten


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad