EngelsFransSpaans

Ad


OnWorks-favicon

mmorph - Online in de cloud

Voer mmorph uit in de gratis hostingprovider van OnWorks via Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Dit is het commando mmorph dat kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

PROGRAMMA:

NAAM


mmorph - MULTEXT morfologietool

KORTE INHOUD


informatie:
mmorf [ -vh ]

alleen ontleden:
mmorf -y | -z [ -a bestand toevoegen ]
-m morfbestand [ -d debug_map ] [ -l logfile ] [ in bestand [ uitbestand ]]

genereren:
mmorf -c | -n [ -t trace_niveau ] [ -s trace_niveau ] [ -a bestand toevoegen ]
-m morfbestand [ -d debug_map ] [ -l logfile ] [ in bestand [ uitbestand ]]

eenvoudig opzoeken:
mmorf [ -fi ] [ -b | -k ] [ -r weigerbestand ]
-m morfbestand [ -d debug_map ] [ -l logfile ] [ in bestand [ uitbestand ]]

record/veld opzoeken:
mmorf -C klassen [ -fu ] [ -E | -O ] [ -b | [ -k ] [ -B klasse ]]
-m morfbestand [ -d debug_map ] [ -l logfile ] [ in bestand [ uitbestand ]]

dump-database:
mmorf -p | -Q
-m morfbestand [ -d debug_map ] [ -l logfile ] [ in bestand [ uitbestand ]]

PRODUCTBESCHRIJVING


In de eenvoudigste bedieningsmodus, met alleen de -m morfbestand keuze, mmorf werkt in
lookup-modus: het opent een bestaande database met de naam morphbestand.db en zoek alles op
tekenreekssegmenten (meestal overeenkomend met woorden) in de invoer.

Gebruik om de database te maken op basis van de lexicale vermeldingen die zijn opgegeven in "morphfile". -c -m
morfbestand. Het bestand morfbestand.db zou niet moeten bestaan. Als de database compleet is, is dat het geval
zoek de segmenten op in de invoer. Indien ineractief gebruikt (invoer en uitvoer is een terminal), a
prompt wordt afgedrukt wanneer het programma verwacht dat de gebruiker een segmentstring typt. Nee
prompting vindt plaats in de record-/veldmodus.

Om de regeltoepassingen te testen op de lexicale ingangen gespecificeerd in morfbestand, zonder
een database maken en zonder segmenten op te zoeken, gebruiken -n -m morfbestand. Deze
stelt het traceringsniveau automatisch in op 1 als dit niet is opgegeven.

Om dezelfde bewerkingen uit te voeren als hierboven, maar op de alternatieve set lexicale ingangen
in bestand toevoegen, gebruik dan de extra optie -a bestand toevoegen. De lexicale ingangen in morphfile zullen zijn
buiten beschouwing gelaten. Dit is handig bij het maken van toevoegingen aan een standaard morfologische beschrijving.
Houd er rekening mee dat vermeldingen aan de database zijn toegevoegd morphbestand.db vervang bestaande niet.

Hoe naar proef a morfologisch beschrijving
Gebruik de -n keuze. Geef in de sectie Grammatica doelregels op die overeenkomen met de gewenste
resultaten. Geef in het gedeelte Lexicon de lexicale items op die u wilt testen. Bij het hardlopen
alle regels worden (recursief) toegepast op de lexicale items, als de regel een doel is, dan
het resultaat van de toepassing wordt afgedrukt op de uitvoer.

Suggestie: plaats de twee hierboven genoemde delen (doelregels en Lexicon-gedeelte) apart
bestanden en verwijs naar deze bestanden met een #include richtlijn waar ze moeten voorkomen in de
belangrijkste invoerbestand.

Als u een bestaande beschrijving gebruikt en alleen nieuwe lexicale ingangen wilt testen, gebruikt u
de opties -n -a bestand toevoegen, en voer de lexicale items in bestand toevoegen.

OPTIES


-a bestand toevoegen
Negeer lexicale ingangen in morphfile, haal ze uit bestand toevoegen gebruiken.

-B klasse
Specificeert de recordklasse die vóór het begin van een zin voorkomt.
Woorden met een hoofdletter die vlak na dergelijke records voorkomen, worden ook bij iedereen opgezocht
hun letters omgezet in kleine letters (volgens LC_CTYPE, zie hieronder).

-b vouw hoofdletters in voordat u opzoekt. Hoofdletters worden omgezet in kleine letters
(volgens LC_CTYPE, zie hieronder) voordat een woord wordt opgezocht.

-C klassen
Bepaalt de opname-/veldmodus. Specificeert de recordklassen die moeten worden bekeken
omhoog. Klassenamen moeten worden gescheiden door een komma ",", TAB, spatie, streep "|" of backslash
"\".

-c Maak een nieuwe database om op te zoeken. De naam van het aangemaakte bestand is de naam van
morfbestand (-m optie) met achtervoegsel .db. Het zou niet moeten bestaan; als het bestaat de gebruiker
moet het handmatig verwijderen voordat u het uitvoert mmorf -c (dit is een minimale bescherming
tegen het per ongeluk overschrijven van een database waar het mogelijk lang over heeft gedaan
creëren).

-d debug_map
Specificeer welke foutopsporingsopties gewenst zijn. Elk stukje erin debug_map komt overeen met een
optie.
bit decimaal hexadecimaal doel
geen bits 0 0x0 geen foutopsporingsoptie (standaard)
1 1 0x1 debug-initialisatie
2 2 0x2 debuggen van yacc-parsing
3 4 0x4 foutopsporingsregelcombinatie
4 8 0x8 debug-spellingtoepassing
5 16 0x10 print statistieken met -p of -q opties
alle bits -1 0xffff alle foutopsporingsopties, wat ze ook zijn
Om opties te combineren, telt u de decimale of hexadecimale waarden bij elkaar op. Voorbeeld: -t 0x5
specificeert bits (opties) 1 en 4.

-E Breidt in de record-/veldmodus de morfologieannotaties uit als ze al bestaan ​​(de
standaard is om bestaande annotaties te laten zoals ze zijn).

-O Overschrijf in record-/veldmodus de morfologieannotaties als deze al bestaan
(de standaard is om bestaande annotaties te laten zoals ze zijn).

-f Flush de uitvoer na elk opzoeken van een segment. Dit is alleen nuttig als invoer en uitvoer
worden doorgesluisd van en naar een programma dat ze moet synchroniseren.

-h Help afdrukken en afsluiten.

-i Voeg aan het resultaat van elke zoekopdracht de identifier van het invoersegment toe
komt overeen met. Momenteel worden invoersegmenten geïdentificeerd aan de hand van hun volgnummer,
beginnend bij 0. Met deze indicatie, de extra nieuwe regel die de oplossingen scheidt
voor verschillende invoersegmenten wordt niet afgedrukt omdat het niet nodig is. Als opzoeken
heeft geen oplossingen, alleen de segment-ID wordt op de uitvoer afgedrukt. Het segment
identifier wordt ook toegevoegd aan afgewezen segmenten. Een tab volgt altijd de
segment identificatie.

-k terugval vouw geval. Als het opzoeken van een woord is mislukt, converteer dan alle hoofdletters naar
kleine letters en probeer het opnieuw op te zoeken. (conversie gebeurt volgens LC_CTYPE, zie
hieronder).

-l logfile
Geef het bestand op voor het schrijven van traceer- en foutberichten. Standaard ingesteld op standaardfout.

-m morfbestand
Geef het bestand op dat de morfologiebeschrijving bevat. Zien mmorf (5) voor een
beschrijving van de syntaxis van het formalisme.

-n Geen aanmaak of opzoeken van databases (testmodus).

-p Dump de getypte functiestructuurdatabase naar outfile (of standaarduitvoer). De
aantal verschillende tfs wordt gegeven in het logbestand (of standaardfout) als bit 5 van debug
optie is ingesteld.

-q Dump de formulieren in de database naar outfile (of standaarduitvoer). Enkele statistieken
worden gegeven in het logbestand (of standaardfout) als bit 5 van de foutopsporingsoptie is ingesteld.

-r weigerbestand
Specificeert in niet-record-/veldmodus het bestand waarin de invoersegmenten moeten worden weggeschreven
kon niet worden opgezocht. Standaard ingesteld op standaardfout.

-s trace_niveau
Spellingsregeltoepassing traceren:
0 geen tracering (standaard).
1 traceer geldige oppervlaktevormen.
2 traceerregels waarvan het lexicale deel overeenkomt.
3 sporen oppervlak linker contextovereenkomst (oppervlaktewoordconstructie).
4 spoor de juiste contextconflicten en regelblokkering op.
5 traceerregel blokkeert niet.
Een trace_level impliceert alle voorgaande.

-t trace_niveau
Specificeer het traceringsniveau voor regeltoepassing:
0 geen tracering (standaard).
1 traceer doelregels die van toepassing zijn.
2 traceer alle regels die van toepassing zijn, inspringing geeft de recursiediepte aan.
10 trace ook regels die zijn uitgeprobeerd maar niet van toepassing waren
Een trace_level impliceert alle voorgaande.

-U In record-/veldmodus zijn onbekende woorden (dwz die zonder succes zijn opgezocht) dat wel
geannoteerd met ??\??.

-v Print versie en sluit af.

-y Alleen parseren: verwerk de beschrijving alleen voor syntaxiscontrole. Terwijl
Bij het ontwikkelen van een morfologiebeschrijving kunt u deze optie gebruiken om syntaxisfouten op te sporen
snel na elke wijziging voordat u het "echt" uitvoert.

-z impliceert -y. Ontleden en uitvoeren van de lexicale beschrijvingen in genormaliseerde vorm.

in bestand bestand met de op te zoeken segmenten, één per regel. Staat standaard op de standaard
invoer.

uitbestand
bestand waarin de uitvoer van het programma is geschreven. Eén regel per oplossing.
Oplossingen van verschillende invoersegmenten worden gescheiden door een lege regel. Standaard naar
de standaarduitvoer.

WOORD GRAMMATICA EN SPELLING REGLEMENT


Voor een gedetailleerd overzicht van de principes en mechanismen die worden gebruikt in mmorf, raadpleeg
de documenten waarnaar wordt verwezen in het gedeelte ZIE OOK hieronder.

Kort geschetste, morfosyntactische beschrijvingen geschreven voor mmorph beschrijven hoe woorden zijn
geconstrueerd door de aaneenschakeling van morfemen, en hoe dit aaneenschakelingsproces verandert
de spelling van deze morfemen. Het eerste deel, de woordstructuurgrammatica, wordt gespecificeerd
door beperkte context vrij herschrijf regels waarvan het formalisme is geïnspireerd op gebaseerd op unificatie
systemen (vgl. Shieber 1986). Het tweede deel, de spellingswijzigingen, wordt gespecificeerd door
spellingsregels in een formalisme gebaseerd op het morfologiemodel met twee niveaus. Deze aanpak
tot morfologie wordt beschreven in Ritchie, Russell et. al, 1992 en beknopter in Pulman
en Heple 1993.

MILIEU VARIABELEN


Om te bepalen welke tekens op de uitvoer kunnen worden weergegeven, mmorf gebruikt de taal
specifieke beschrijving dat plaats instellen(3) sets volgens de omgevingsvariabele
LC_CTYPE. Voor de talen die in MULTEXT worden behandeld, is het een goed idee om dat te hebben
variabele ingesteld op iso_8859_1.

Voorbeelden


Hier is een samenvatting van het algemene gebruik van mmorph-opties:

mmorf -n -m morfbestand
Testmodus: leest het volledige morphfile en drukt de resultaten af ​​op standaardfout. Geen databank
wordt gemaakt, worden geen woorden opgezocht.

mmorf -c -m morfbestand
Database creatie: leest het volledige morphfile en slaat de resultaten op in een database
(morfbestand.db). Getypte kenmerkstructuren worden verzameld in een apart bestand
(morfbestand.tfs). Standaard invoer wordt gelezen om woorden op te zoeken in de nieuwe database.

mmorf -m morfbestand
Opzoekmodus: leest alleen de secties Alphabets, Attributes en Types van morphfile.
Standaard invoer wordt gelezen om woorden op te zoeken volgens de bestaande database
(mmorphfile.db en morphfile.tfs).

mmorf -m morfbestand -a bestand toevoegen
Toevoegingsmodus: negeert de Lexicon-sectie van morphfile, maar addfile wordt geraadpleegd, en
de resultaten worden toegevoegd aan de database. Standaard invoer wordt gelezen om woorden op te zoeken
volgens de uitgebreide database (mmorphfile.db en morphfile.tfs).

DIAGNOSE


Foutmeldingen moeten voor zichzelf spreken. Raadpleeg mmorf(5) voor een formele
beschrijving van de syntaxis.

Gebruik mmorph online met behulp van onworks.net-services


Gratis servers en werkstations

Windows- en Linux-apps downloaden

  • 1
    SLOK
    SLOK
    SWIG is een tool voor softwareontwikkeling
    dat programma's verbindt die zijn geschreven in C en
    C ++ met een verscheidenheid aan high-level
    programmeertalen. SWIG wordt gebruikt met
    verschillend...
    SWIG downloaden
  • 2
    WooCommerce Nextjs React-thema
    WooCommerce Nextjs React-thema
    Reageer WooCommerce-thema, gebouwd met
    Volgende JS, Webpack, Babel, Node en
    Express, met behulp van GraphQL en Apollo
    Cliënt. WooCommerce Store in React(
    bevat: Producten...
    Download het WooCommerce Nextjs React-thema
  • 3
    archlabs_repo
    archlabs_repo
    Pakketrepo voor ArchLabs Dit is een
    toepassing die ook kan worden opgehaald
    oppompen van
    https://sourceforge.net/projects/archlabs-repo/.
    Het is gehost in OnWorks in...
    Archlabs_repo downloaden
  • 4
    Zephyr-project
    Zephyr-project
    Het Zephyr Project is een nieuwe generatie
    real-time besturingssysteem (RTOS) dat
    ondersteunt meerdere hardware
    architecturen. Het is gebaseerd op een
    kernel met kleine voetafdruk ...
    Zephyr-project downloaden
  • 5
    SConen
    SConen
    SCons is een softwareconstructietool
    dat is een superieur alternatief voor de
    klassieke "Make" build-tool die
    we kennen en houden allemaal van. SCons is
    implementeerde een...
    SCons downloaden
  • 6
    PSeInt
    PSeInt
    PSeInt is een pseudo-code-interpreter voor
    Spaanstalige programmeerstudenten.
    Het belangrijkste doel is om een ​​hulpmiddel te zijn voor:
    de basis leren en begrijpen
    concept...
    PSeInt downloaden
  • Meer "

Linux-commando's

Ad