EnglischFranzösischSpanisch

Ad


OnWorks-Favicon

mmorph - Online in der Cloud

Führen Sie mmorph im kostenlosen OnWorks-Hosting-Provider über Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator aus

Dies ist der Befehl mmorph, der im kostenlosen OnWorks-Hosting-Provider über eine unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


mmorph - MULTEXT-Morphologie-Tool

ZUSAMMENFASSUNG


Informationen:
verwandeln [ -vh ]

nur analysieren:
verwandeln -y | -z [ -a Datei hinzufügen ]
-m Morphdatei [ -d debug_map ] [ -l Logdatei ] [ im Ordner [ Outfile ]]

generieren:
verwandeln -c | -n [ -t Ablaufverfolgungsebene ] [ -s Ablaufverfolgungsebene ] [ -a Datei hinzufügen ]
-m Morphdatei [ -d debug_map ] [ -l Logdatei ] [ im Ordner [ Outfile ]]

einfache Suche:
verwandeln [ -Sei ] [ -b | -k ] [ -r ablehnen ]
-m Morphdatei [ -d debug_map ] [ -l Logdatei ] [ im Ordner [ Outfile ]]

Datensatz-/Feldsuche:
verwandeln -C Unterricht [ -fU ] [ -E | -O ] [ -b | [ -k ] [ -B Klasse ]]
-m Morphdatei [ -d debug_map ] [ -l Logdatei ] [ im Ordner [ Outfile ]]

Dump-Datenbank:
verwandeln -p | -Q
-m Morphdatei [ -d debug_map ] [ -l Logdatei ] [ im Ordner [ Outfile ]]

BESCHREIBUNG


In einfachster Bedienung, mit nur dem -m Morphdatei Option, verwandeln arbeitet in
Lookup-Modus: Es wird eine vorhandene Datenbank namens . geöffnet morphfile.db und suche alle
Zeichenfolgensegmente (die normalerweise Wörtern entsprechen) in der Eingabe.

Um die Datenbank aus den in "morphfile" angegebenen lexikalischen Einträgen zu erstellen, verwenden Sie -c -m
Morphdatei. Die Datei Morphdatei.db sollte nicht existieren. Wenn die Datenbank fertig ist, wird sie
Suchen Sie die Segmente in der Eingabe. Bei ineraktiver Verwendung (Ein- und Ausgang ist eine Klemme), a
Die Eingabeaufforderung wird gedruckt, wenn das Programm erwartet, dass der Benutzer eine Segmentzeichenfolge eingibt. Nein
Die Eingabeaufforderung erfolgt im Aufnahme-/Feldmodus.

Um die Regelanwendungen für die in angegebenen lexikalischen Einträge zu testen Morphdatei, ohne
Erstellen einer Datenbank und ohne nach Segmenten zu suchen, verwenden Sie -n -m Morphdatei. Dies
setzt den Trace-Level automatisch auf 1, wenn er nicht angegeben wurde.

Um die gleichen Operationen wie oben auszuführen, jedoch mit dem alternativen Satz lexikalischer Einträge
in Datei hinzufügen, nutze die Zusatzoption -a Datei hinzufügen. Die lexikalischen Einträge in morphfile sind
ignoriert. Dies ist nützlich, wenn Sie Ergänzungen zu einer morphologischen Standardbeschreibung vornehmen.
Beachten Sie, dass der Datenbank hinzugefügte Einträge morphfile.db bestehende nicht ersetzen.

Ultraschall zu Test a morphologisch Beschreibung
Verwenden Sie das -n Möglichkeit. Geben Sie im Abschnitt Grammatik die Zielregeln an, die dem gewünschten entsprechen
Ergebnisse. Geben Sie im Abschnitt Lexikon die lexikalischen Elemente an, die Sie testen möchten. Beim Laufen
alle Regeln werden (rekursiv) auf die lexikalischen Elemente angewendet, wenn die Regel ein Ziel ist, dann
das Ergebnis der Anwendung wird auf der Ausgabe ausgegeben.

Vorschlag: Legen Sie die beiden oben genannten Teile (Zielregeln und Lexikonteil) getrennt
Dateien und referenzieren Sie diese Dateien mit einem #einschließen Richtlinie, wo sie in der
Haupteingabedatei.

Wenn Sie eine vorhandene Beschreibung verwenden und nur neue lexikalische Einträge testen möchten, verwenden Sie
die Optionen -n -a Datei hinzufügen, und fügen Sie die lexikalischen Einträge in Datei hinzufügen.

OPTIONAL


-a Datei hinzufügen
Ignoriere lexikalische Einträge in Morphfile, nimm sie aus Datei hinzufügen stattdessen.

-B Klasse
Gibt die Datensatzklasse an, die vor dem Satzanfang auftritt.
Großgeschriebene Wörter, die unmittelbar nach solchen Datensätzen vorkommen, werden ebenfalls mit allen nachgeschlagen
ihre Buchstaben in Kleinbuchstaben umgewandelt (gemäß LC_CTYPE, siehe unten).

-b Faltetui vor der Suche. Großbuchstaben werden in Kleinbuchstaben umgewandelt
(gemäß LC_CTYPE, siehe unten) bevor ein Wort nachgeschlagen wird.

-C Unterricht
Bestimmt den Aufnahme-/Feldmodus. Gibt die Datensatzklassen an, die gesucht werden sollen
hoch. Klassennamen sollten durch Komma ",", TAB, Leerzeichen, Strich "|" getrennt werden oder Backslash
"\".

-c Erstellen Sie eine neue Datenbank für die Suche. Der Name der erstellten Datei ist der Name von
Morphdatei (-m Option) mit Suffix .db. Es sollte nicht existieren; wenn es existiert der Benutzer
sollte es vor dem Ausführen manuell entfernen verwandeln -c (Dies ist ein minimaler Schutz
gegen versehentliches Überschreiben einer Datenbank, die möglicherweise lange gedauert hat
schaffen).

-d debug_map
Geben Sie an, welche Debug-Optionen gewünscht werden. Jedes Bit in debug_map entspricht einem
.
bit dezimal hexadezimal Zweck
keine Bits 0 0x0 keine Debug-Option (Standard)
1 1 0x1 Debug-Initialisierung
2 2 0x2 Debug-Yacc-Parsing
3 4 0x4 Debug-Regelkombination
4 8 0x8 Debug-Rechtschreibanwendung
5 16 0x10 Druckstatistik mit den Optionen -p oder -q
alle Bits -1 0xffff alle Debug-Optionen, was auch immer sie sind
Um Optionen zu kombinieren, addieren Sie die Dezimal- oder Hexadezimalwerte. Beispiel: -t 0x5
spezifiziert die Bits (Optionen) 1 und 4.

-E Erweitert im Datensatz-/Feldmodus die Morphologie-Anmerkungen, wenn sie bereits vorhanden sind (die
Standardmäßig werden vorhandene Anmerkungen unverändert belassen).

-O Überschreiben Sie im Datensatz-/Feldmodus die Morphologie-Anmerkungen, wenn sie bereits vorhanden sind
(Standardmäßig werden vorhandene Anmerkungen unverändert belassen).

-f Leeren Sie die Ausgabe nach jeder Segmentsuche. Dies ist nur sinnvoll, wenn Input und Output
werden von und zu einem Programm geleitet, das sie synchronisieren muss.

-h Hilfe ausdrucken und beenden.

-i Stellen Sie dem Ergebnis jeder Suche die Kennung des Eingabesegments it . voran
entspricht. Derzeit werden Eingabesegmente durch ihre fortlaufende Nummer identifiziert,
beginnend bei 0. Bei dieser Angabe wird der zusätzliche Zeilenumbruch zwischen den Lösungen
für verschiedene Eingabesegmente wird nicht gedruckt, da es nicht benötigt wird. Wenn eine Suche
hat keine Lösungen, nur die Segmentkennung wird auf der Ausgabe ausgegeben. Das Segment
Bezeichner wird auch abgelehnten Segmenten vorangestellt. Ein Tab folgt immer dem
Segmentkennung.

-k Fallback-Falthülle. Wenn eine Wortsuche fehlgeschlagen ist, konvertieren Sie alle Großbuchstaben in
Kleinbuchstaben und versuchen Sie die Suche erneut. (Konvertierung erfolgt nach LC_CTYPE, siehe
unten).

-l Logdatei
Geben Sie die Datei zum Schreiben von Trace- und Fehlermeldungen an. Standardmäßig auf Standardfehler.

-m Morphdatei
Geben Sie die Datei mit der Morphologiebeschreibung an. Sehen verwandeln (5) für eine
Beschreibung der Syntax des Formalismus.

-n Keine Datenbankerstellung oder -suche (Testmodus).

-p Geben Sie die typisierte Featurestruktur-Datenbank in eine Outfile-Datei (oder Standardausgabe) aus. Die
Anzahl der verschiedenen tfs wird in der Logdatei (oder Standardfehler) angegeben, wenn Bit 5 von Debug
Option ist gesetzt.

-q Geben Sie die Formulare in der Datenbank in Outfile (oder Standardausgabe) aus. Einige Statistiken
werden in der Logdatei (oder Standardfehler) angegeben, wenn Bit 5 der Debug-Option gesetzt ist.

-r ablehnen
Gibt im Nicht-Datensatz-/Feldmodus die Datei an, in die Eingabesegmente geschrieben werden, die
konnte nicht nachgeschaut werden. Standardmäßig auf Standardfehler.

-s Ablaufverfolgungsebene
Anwendung von Rechtschreibregeln verfolgen:
0 kein Tracing (Standard).
1 Spur gültiger Oberflächenformen.
2 Ablaufverfolgungsregeln, deren lexikalischer Teil übereinstimmt.
3 Trace Surface Left Context Match (Oberflächenwortkonstruktion).
4 Trace Surface Right Context Nichtübereinstimmung und Regelblockierung.
5 Verfolgungsregel nicht blockierend.
Ein trace_level impliziert alle vorhergehenden.

-t Ablaufverfolgungsebene
Geben Sie die Tracestufe für die Regelanwendung an:
0 kein Tracing (Standard).
1 anwendbare Zielverfolgungsregeln.
2 alle zutreffenden Regeln verfolgen, Einrückung gibt die Rekursionstiefe an.
10 verfolgen auch Regeln, die versucht wurden, aber nicht angewendet wurden
Ein trace_level impliziert alle vorhergehenden.

-U Im Record/Field-Modus werden unbekannte Wörter (dh die erfolglos nachgeschlagen wurden)
mit ??\?? versehen.

-v Version drucken und beenden.

-y Nur Parsen: Verarbeiten Sie die Beschreibung nur zur Syntaxprüfung. Während
Wenn Sie eine Morphologiebeschreibung entwickeln, können Sie diese Option verwenden, um Syntaxfehler abzufangen
schnell nach jeder Änderung, bevor Sie es "real" ausführen.

-z impliziert -y. Analysieren und geben Sie die lexikalischen Beschreibungen in normalisierter Form aus.

im Ordner Datei, die die nachzuschlagenden Segmente enthält, eines pro Zeile. Standardeinstellungen
Eingang.

Outfile
Datei, in die die Ausgabe des Programms geschrieben wird. Eine Zeile pro Lösung.
Lösungen verschiedener Eingabesegmente werden durch eine Leerzeile getrennt. Standardmäßig auf
die Standardausgabe.

WORD GRAMMATIK UND RECHTSCHREIBUNG REGELN


Für eine detaillierte Darstellung der Prinzipien und Mechanismen, die in wandeln, bitte beziehen Sie sich auf
die im Abschnitt SIEHE AUCH unten zitierten Dokumente.

Kurz skizziert beschreiben morphosyntaktische Beschreibungen, die für mmorph geschrieben wurden, wie Wörter sind
durch die Verkettung von Morphemen konstruiert und wie sich dieser Verkettungsprozess ändert
die Schreibweise dieser Morpheme. Der erste Teil, die Wortstrukturgrammatik, wird spezifiziert
durch eingeschränkte kontextfreie Rewrite-Regeln, deren Formalismus von der Vereinheitlichung inspiriert ist
Systeme (vgl. Shieber 1986). Der zweite Teil, die Schreibweise ändert sich, wird spezifiziert durch
Rechtschreibregeln in einem Formalismus basierend auf dem zweistufigen Modell der Morphologie. Dieser Ansatz
zur Morphologie ist in Ritchie, Russell et. al, 1992 und prägnanter in Pulman
und Hepple 1993.

VARIABLEN


Um zu entscheiden, welche Zeichen auf der Ausgabe angezeigt werden können, verwandeln verwendet die Sprache
spezifische Beschreibung, die setlocale(3) Mengen entsprechend der Umgebungsvariablen
LC_CTYPE. Für die Sprachen, die in MULTEXT behandelt werden, ist es eine gute Idee, dies zu haben
Variable auf gesetzt iso_8859_1.

Beispiele:


Hier ist eine Zusammenfassung der allgemeinen Verwendung von mmorph-Optionen:

verwandeln -n -m Morphdatei
Testmodus: Liest die gesamte Morphdatei und druckt die Ergebnisse auf Standardfehler. Keine Datenbank
erstellt wird, werden keine Wörter nachgeschlagen.

verwandeln -c -m Morphdatei
Datenbankerstellung: liest das gesamte Morphfile und speichert die Ergebnisse in einer Datenbank
(morphfile.db). Typisierte Feature-Strukturen werden in einer separaten Datei gesammelt
(morphfile.tfs). Für Wörter, die in der neuen Datenbank nachzuschlagen sind, wird die Standardeingabe gelesen.

verwandeln -m Morphdatei
Lookup-Modus: liest nur die Abschnitte Alphabets, Attributes und Types von Morphfile.
Die Standardeingabe wird für Wörter gelesen, die gemäß der vorhandenen Datenbank nachgeschlagen werden können
(mmorphfile.db und morphfile.tfs).

verwandeln -m Morphdatei -a Datei hinzufügen
Additionsmodus: ignoriert den Lexikon-Abschnitt von morphfile, aber addfile wird konsultiert und
die Ergebnisse werden der Datenbank hinzugefügt. Die Standardeingabe wird gelesen, um Wörter nachzuschlagen
entsprechend der erweiterten Datenbank (mmorphfile.db und morphfile.tfs).

DIAGNOSE


Fehlermeldungen sollten selbsterklärend sein. Bitte beziehen Sie sich auf verwandeln(5) für ein formelles
Beschreibung der Syntax.

Verwenden Sie mmorph online mit den onworks.net-Diensten


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

  • 1
    SCHLUCK
    SCHLUCK
    SWIG ist ein Softwareentwicklungstool
    das verbindet in C geschriebene Programme und
    C++ mit einer Vielzahl von High-Level
    Programmiersprachen. SWIG wird mit verwendet
    anders...
    SWIG herunterladen
  • 2
    WooCommerce Nextjs Reaktionsthema
    WooCommerce Nextjs Reaktionsthema
    Reagieren Sie mit dem WooCommerce-Theme, das mit erstellt wurde
    Als nächstes JS, Webpack, Babel, Node und
    Express mit GraphQL und Apollo
    Klient. WooCommerce-Shop in React(
    enthält: Produkte...
    Laden Sie WooCommerce Nextjs React Theme herunter
  • 3
    archlabs_repo
    archlabs_repo
    Paket-Repo für ArchLabs Dies ist eine
    Anwendung, die auch abgerufen werden kann
    für
    https://sourceforge.net/projects/archlabs-repo/.
    Es wurde in OnWorks gehostet in...
    Laden Sie archlabs_repo herunter
  • 4
    Zephyr-Projekt
    Zephyr-Projekt
    Das Zephyr Project ist eine neue Generation
    Echtzeitbetriebssystem (RTOS), das
    unterstützt mehrere Hardware
    Architekturen. Es basiert auf einer
    Kernel mit kleinem Fußabdruck ...
    Laden Sie das Zephyr-Projekt herunter
  • 5
    SCons
    SCons
    SCons ist ein Software-Konstruktionstool
    das ist eine überlegene Alternative zum
    klassisches "Make"-Build-Tool, das
    wir alle kennen und lieben. SCons ist
    implementiert ein...
    Laden Sie SCons herunter
  • 6
    PSInt
    PSInt
    PSeInt ist ein Pseudocode-Interpreter für
    spanischsprachige Programmierstudenten.
    Sein Hauptzweck ist es, ein Werkzeug für
    Grundlegendes lernen und verstehen
    Konzept...
    PSeInt herunterladen
  • Mehr »

Linux-Befehle

Ad