het EngelsFransSpaans

Servers draaien | Ubuntu > | Fedora > |


OnWorks-favicon

icombine - Online in de cloud

Voer icombine uit in OnWorks gratis hostingprovider via Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Dit is de opdracht icombine die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

PROGRAMMA:

NAAM


ispell, buildhash, munchlist, findaffix, tryaffix, icombine, ijoin - Interactieve spelling
controleren

KORTE INHOUD


ik spel [gemeenschappelijke vlaggen] [-M|-N] [-Lverband] [-V] bestanden
ik spel [gemeenschappelijke vlaggen] -l
ik spel [gemeenschappelijke vlaggen] [-f het dossier] [-s] [-a|-A]
ik spel [-d filet] [-w chars] -c
ik spel [-d filet] [-w chars] -e[e]
ik spel [-d filet] -D
ik spel -v[v]

gemeenschappelijke vlaggen:
[-t] [-n] [-H] [-o] [-b] [-x] [-B] [-C] [-P] [-m] [-S] [-d filet] [-p filet] [-w
chars] [-W n] [-T type dan: ] [-knaam lijst] [-F programma]

Hulpprogramma's:

buildhash [-s] dict-bestand affix-bestand hash-bestand
buildhash -s tellen affix-bestand

munchlist [-l aff-bestand] [-c conv-bestand] [-T achtervoegsel]
[-s hash-bestand] [-D] [-v] [-w chars] [bestanden]

vindaffix [-p|-s] [-f] [-c] [-m Min] [-M max] [-e Elim]
[-t tabchar] [-l lage] [bestanden]

probeeraffix [-p|-s] [-c] uitgebreid-bestand bevestigen [+toevoeging]

icombineren [-T type dan: ] [-w chars] [aff-bestand]

ik doe mee [-s|-u] join-opties file1 file2

PRODUCTBESCHRIJVING


Ik spel is gevormd na de spellen programma van ITS (genaamd ik spel op Twenex-systemen.)
Het meest voorkomende gebruik is "ispell bestandsnaam". In dit geval, ik spel zal elk woord weergeven
die niet in het woordenboek bovenaan het scherm verschijnt en u kunt wijzigen
het. Als er "bijna-ongevallen" in het woordenboek staan ​​(woorden die slechts één enkele
letter, een ontbrekende of extra letter, een paar getransponeerde letters of een ontbrekende spatie of
koppelteken), dan worden ze ook weergegeven op de volgende regels. Evenals "bijna-ongevallen",
ispell kan andere gissingen weergeven over manieren om het woord van een bekende wortel te maken, met elk
raden voorafgegaan door vraagtekens. Ten slotte de regel met het woord en de vorige
regel worden onderaan het scherm afgedrukt. Als uw terminal omgekeerd kan weergeven
video, wordt het woord zelf gemarkeerd. U heeft de mogelijkheid om het woord te vervangen
volledig, of kies een van de voorgestelde woorden. Commando's zijn enkele tekens als
volgt (hoofdlettergebruik wordt genegeerd):

R Vervang het verkeerd gespelde woord volledig.

Spatie Accepteer het woord alleen deze keer.

A Accepteer het woord voor de rest van dit ik spel sessie.

I Accepteer het woord, met een hoofdletter zoals het in het bestand staat, en update privé
woordenboek.

U Accepteer het woord en voeg een versie zonder hoofdletter toe (eigenlijk alleen in kleine letters)
naar het privéwoordenboek.

0-n Vervang door een van de voorgestelde woorden.

L Zoek woorden op in het systeemwoordenboek (beheerd door de WORDS-compilatie
keuze).

X Schrijf de rest van dit bestand, negeer spelfouten, en start het volgende bestand.

Q Sluit onmiddellijk af en laat het bestand ongewijzigd.

! Schelpen ontsnappen.

^L Scherm opnieuw tekenen.

^Z Ispell opschorten.

? Help-scherm geven.

Indien de -M schakelaar is opgegeven, zal een minimenu met één regel onder aan het scherm
vat deze opties samen. Omgekeerd, de -N schakelaar kan worden gebruikt om het minimenu te onderdrukken.
(Het minimenu wordt standaard weergegeven als ik spel is gecompileerd met de MINIMENU-optie, maar
deze twee schakelaars zullen altijd de standaard overschrijven).

Indien de -L vlag wordt gegeven, wordt het opgegeven aantal gebruikt als het aantal regels context om
worden weergegeven aan de onderkant van het scherm (de standaard is om de hoeveelheid context te berekenen als
een bepaald percentage van de schermgrootte). De hoeveelheid context is onderhevig aan een systeem-
opgelegde limiet.

Indien de -V vlag wordt gegeven, tekens die niet in de 7-bits ANSI-afdrukbare tekenset staan
wordt altijd weergegeven in de stijl van "cat -v", zelfs als ik spel denkt dat deze
tekens zijn legaal ISO Latin-1 op uw systeem. Dit is handig bij het werken met oudere
terminals. Zonder deze schakelaar ik spel zullen 8-bit karakters "zoals ze zijn" weergeven als ze dat hebben
gedefinieerd als tekenreekstekens voor het gekozen bestandstype.

"Normale" modus, evenals de -l, -a en -A opties en interactieve modus (zie hieronder) ook
accepteert de volgende "gewone" vlaggen op de opdrachtregel:

-t Het invoerbestand is in TeX- of LaTeX-indeling.

-n Het invoerbestand is in nroff/troff-formaat.

-H Het invoerbestand is in SGML/HTML-indeling. (Dit zou echt moeten zijn) -s, maar voor
historische redenen dat die vlag al in gebruik was.)

-o Het invoerbestand moet worden behandeld als gewone tekst. (Dit kan worden gebruikt om
DEFTEXFLAG negeren.)

-g Het invoerbestand is in de Debian-besturingsbestandsindeling. Ispell zal negeren
alles buiten de Beschrijving(en).

-b Maak een back-upbestand door ".bak" toe te voegen aan de naam van het invoerbestand.

-x Verwijder het back-upbestand nadat de spellingcontrole is voltooid.

-B Rapporteer samenloopwoorden met ontbrekende spaties als spelfouten.

-C Beschouw samenloopwoorden als juridische verbindingen.

-P Genereer geen extra root/affix-combinaties.

-m Maak mogelijke root/affix-combinaties die niet in het woordenboek staan.

-S Sorteer de lijst met gissingen op waarschijnlijke juistheid.

-d filet
Geef een alternatief woordenboekbestand op. Gebruik bijvoorbeeld -d Brits kiezen
/usr/lib/ispell/british.{aff|hash} in plaats van uw standaard ispell
woordenboek.

-p filet
Geef een alternatief persoonlijk woordenboek op.

-w chars
Geef extra tekens op die deel kunnen uitmaken van een woord.

-W n Specificeer de lengte van woorden die altijd legaal zijn.

-T type dan:
Ga uit van een bepaald formattertype voor alle bestanden.

Het -H, -n, -t en -o opties selecteer of ik spel draait in HTML (-H), nroff/troff (-n),
TeX/LaTeX (-t), of gewone tekst (-o) invoer modus. modus. (De standaardmodus wordt gecontroleerd)
door de DEFTEXFLAG-installatieoptie, maar is normaal gesproken nroff/troff-modus voor historisch
redenen.) Tenzij overschreven door een van de moduskeuzeschakelaars, is de TeX/LaTeX-modus:
automatisch geselecteerd als een invoerbestand de extensie ".tex" heeft en HTML-modus is
automatisch geselecteerd als een invoerbestand de extensie ".html" of ".htm" heeft.

In HTML-modus worden HTML-tags die worden gescheiden door <>-tekens overgeslagen, behalve dat de "ALT="
constructie wordt herkend als deze verschijnt zonder spaties rond het isgelijkteken, en de tekst
binnenkant is op spelling gecontroleerd.

Wanneer in de TeX/LaTeX-modus een backslash ("\") wordt gevonden, ik spel zal naar de volgende gaan
witruimte of TeX/LaTeX-scheidingsteken. Bepaalde commando's bevatten argumenten die niet zouden moeten zijn
aangevinkt, zoals labels en referentiesleutels zoals gevonden in het \cite-commando, aangezien ze
willekeurige, niet-woord-argumenten bevatten. Spellingcontrole wordt ook onderdrukt in wiskunde
modus. Zo wordt bijvoorbeeld gegeven

\hoofdstuk {Dit is een Ckapter} \cite{SCH86}

ik spel vindt "Ckapter" maar niet "SCH". De -t optie herkent de TeX . niet
commentaarteken "%", dus opmerkingen worden ook op spelling gecontroleerd. Het veronderstelt ook correcte LaTeX
syntaxis. Argumenten voor zelden gebruikte commando's en sommige optionele argumenten zijn soms
onnodig gecontroleerd. De bibliografie wordt niet gecontroleerd als: ik spel is samengesteld met
NEGEERBIB bepaald. Anders wordt de bibliografie gecontroleerd, maar de referentiesleutel wel
niet.

Referenties voor de tib (indien beschikbaar op uw systeem), bibliografiesysteem, dat wil zeggen, tekst
tussen een ``[.'' of ``<.'' en ``.]'' of ``.>'' worden altijd genegeerd in de TeX/LaTeX-modus.

Het -b en -x opties bepalen of: ik spel laat een back-upbestand (.bak) achter voor elke invoer
het dossier. Het .bak-bestand bevat de vooraf gecorrigeerde tekst. Als er bestanden worden geopend / geschreven
fouten, kan het .bak-bestand worden achtergelaten voor hersteldoeleinden, zelfs met de -x optie. De
standaard voor deze optie wordt beheerd door de DEFNOBACKUPFLAG-installatieoptie.

Het -B en -C opties bepalen hoe ik spel verwerkt samenloopwoorden, zoals "niet de" voor
"niet de". Indien -B is opgegeven, worden dergelijke woorden als fouten beschouwd, en ik spel wil
lijst variaties met een ingevoegde spatie of koppelteken als mogelijke vervangingen. Indien -C is
gespecificeerde, samenvallende woorden worden beschouwd als legale samenstellingen, zolang beide
onderdelen staan ​​in het woordenboek en elk onderdeel is minstens zo lang als een taal-
afhankelijk minimum (3 tekens, standaard). Dit is handig voor talen zoals Duits
en Noors, waar veel samengestelde woorden worden gevormd door aaneenschakeling. (Let daar op
verbindingen gevormd uit drie of meer grondwoorden worden nog steeds als fouten beschouwd). De
standaard voor deze optie is taalafhankelijk; in een meertalige installatie is de standaard
kan variëren, afhankelijk van het woordenboek dat u kiest. Waarschuwing: het -C optie kan veroorzaken
ik spel om niet-woorden en spelfouten te herkennen. Gebruik het met de nodige voorzichtigheid!

Het -P en -m opties bepalen wanneer: ik spel genereert automatisch voorgestelde root/affix
combinaties voor eventuele aanvulling op uw persoonlijke woordenboek. (Dit zijn de vermeldingen in
de "gissing"-lijst die wordt voorafgegaan door vraagtekens.) Als -P is gespecificeerd, dergelijke gissingen
worden alleen weergegeven als ik spel kan geen mogelijkheden genereren die overeenkomen met de stroom
woordenboek. Indien -m is opgegeven, worden dergelijke gissingen altijd weergegeven. Dit kan handig zijn als:
het woordenboek heeft een beperkte woordenlijst, of een woordenlijst met weinig achtervoegsels. Echter, jij
moet voorzichtig zijn bij het gebruik van deze optie, omdat het gissingen kan genereren die illegale . produceren
woorden. De standaardwaarde voor deze optie wordt bepaald door het gebruikte woordenboekbestand.

Het -S optie onderdrukt ik spelnormaal gedrag van het sorteren van de lijst met mogelijke
vervangende woorden. Sommige mensen geven hier misschien de voorkeur aan, omdat het de
kans dat het juiste woord laaggenummerd is.

Het -d optie wordt gebruikt om een ​​alternatief gehasht woordenboekbestand op te geven, anders dan de
standaard. Als de bestandsnaam geen "/" bevat, is de bibliotheekmap voor de standaard
woordenboekbestand wordt voorafgegaan door; dus, om een ​​woordenboek te gebruiken in de lokale map "-d
./xxx.hash" moet worden gebruikt. Dit is handig om woordenboeken voor alternatieve talen toe te staan.
In tegenstelling tot eerdere versies van ik spel, een woordenboek van / Dev / null is illegaal, omdat de
woordenboek bevat de affixtabel. Als je een effectief leeg woordenboek nodig hebt, maak dan
een lijst met één item met een onwaarschijnlijke tekenreeks (bijv. "qqqqq").

Het -p optie wordt gebruikt om een ​​alternatief persoonlijk woordenboekbestand op te geven. Als de bestandsnaam
begint niet met "/", wordt $HOME voorafgegaan. Ook kan de shell-variabele WORDLIST worden ingesteld,
die het persoonlijke woordenboek op dezelfde manier hernoemt. De opdrachtregel overschrijft elke
WOORDENLIJST instelling. Als geen van beide -p switch noch de WORDLIST-omgevingsvariabele is
gegeven, ik spel zal zoeken naar een persoonlijk woordenboek in zowel de huidige directory als
$HOME, maak er een aan in $HOME als er geen wordt gevonden. De voorkeursnaam wordt geconstrueerd door
".ispell_" toevoegen aan de basisnaam van het hashbestand. Als u bijvoorbeeld de
Engels woordenboek, uw persoonlijke woordenboek zou ".ispell_english" heten. Echter,
als het bestand ".ispell_words" bestaat, wordt het hoe dan ook gebruikt als het persoonlijke woordenboek
van het gekozen taalhashbestand. Deze functie is voornamelijk opgenomen voor achteruit
compatibiliteit.

Indien de -p Optie is geen gespecificeerd, ik spel zoekt naar persoonlijke woordenboeken in zowel de
huidige directory en de homedirectory. Als er op beide plaatsen woordenboeken bestaan, zullen ze:
worden samengevoegd. Als er woorden aan het persoonlijke woordenboek worden toegevoegd, worden ze naar het
huidige map als er al een woordenboek op die plaats bestond; anders zullen ze zijn
geschreven naar het woordenboek in de homedirectory.

Het -w optie kan worden gebruikt om andere tekens dan alfabetische tekens op te geven, wat ook kan:
verschijnen in woorden. Bijvoorbeeld, -w Met "&" kan "AT&T" worden opgehaald. Onderstrepingstekens zijn
bruikbaar in veel technische documenten. Er is een weliswaar grove bepaling in deze optie
voor 8-bit internationale tekens. Niet-afdrukbare tekens kunnen worden opgegeven in de gebruikelijke
manier door een backslash in te voegen gevolgd door de octale tekencode; bijv. "\014" voor een formulier
voeden. Als alternatief, als "n" in de tekenreeks verschijnt, kunnen de (maximaal) drie tekens
volgende zijn een DECIMALE code 0 - 255, voor het teken. Om bijvoorbeeld bellen op te nemen
en voer feeds in je woorden in (toegegeven, dwaas om te doen, maar het is niet erg pedagogisch)
voorbeelden):

n007n012

Numerieke cijfers anders dan de drie volgende "n" zijn gewoon numerieke tekens. Gebruik van
"n" is nergens mee in strijd, omdat echte alfabetten geen betekenis hebben -
alfabetische tekens zijn al geaccepteerd. Ik spel wordt meestal gebruikt met invoer uit een bestand,
wat betekent dat het behouden van de pariteit voor mogelijke 8-bits tekens uit de invoertekst OK is.
Als u de optie -l specificeert, en daadwerkelijk tekst typt vanuit de terminal, kan dit leiden tot
problemen als uw stty-instellingen de pariteit behouden.

Het is niet mogelijk om te gebruiken -w met bepaalde karakters. In het bijzonder de vlagmarkering
teken voor de taal (gedefinieerd in het affix-bestand, maar meestal "/") kan nooit worden gemaakt
in een woordkarakter.

Het -W optie kan worden gebruikt om de lengte van woorden die ik spel accepteert altijd als
legaal. Normaal gesproken, ik spel accepteert alle woorden van 1 letter als legaal, wat equivalent is
specificeren "-W 1." (De standaardinstelling voor deze schakeloptie wordt feitelijk bestuurd door het MINWORD
installatieoptie, dus het kan per installatie verschillen.) Als u wilt dat alle woorden zijn:
gecontroleerd aan de hand van het woordenboek, ongeacht de lengte, wilt u misschien specificeren "-W 0."
Aan de andere kant, als uw document veel acroniemen van drie letters bevat, zou u:
specificeer "-W 3" om alle woorden van drie letters of minder te accepteren. Ongeacht de instelling van
deze optie, ik spel genereert alleen woorden die in het woordenboek staan ​​zoals gesuggereerd
vervangingen voor woorden; dit voorkomt dat de lijst te lang wordt. Het is duidelijk dat dit
optie kan erg gevaarlijk zijn, omdat korte spelfouten kunnen worden gemist. Als je dit gebruikt
optie veel, moet u waarschijnlijk een laatste keer zonder maken voordat u uw . publiceert
document, om uzelf tegen fouten te beschermen.

Het -T optie wordt gebruikt om een ​​standaard formattertype op te geven voor gebruik bij het genereren van string
karakters. Deze schakeloptie heft het standaardtype op dat wordt bepaald op basis van de bestandsnaam. De
type dan: argument kan een van de unieke namen zijn die zijn gedefinieerd in het taalaffixbestand
(Bv nroff) of een bestandssuffix inclusief de punt (bijv. .tex). Als Nee -T optie verschijnt
en er kan geen type worden bepaald aan de hand van de bestandsnaam, het standaard tekenreekstype
gedeclareerd in het taalaffixbestand zal worden gebruikt.

Het -k optie wordt gebruikt om het gedrag van bepaalde deformatters te verbeteren. De naam parameter
geeft de naam van een deformatter-sleutelwoordenset (zie hieronder), en de lijst parameter geeft a
lijst met een of meer trefwoorden die speciaal moeten worden behandeld. Indien lijst begint met een plus
(+) teken, het wordt toegevoegd aan de bestaande trefwoorden; anders vervangt het het bestaande trefwoord
lijst. Bijvoorbeeld, -ktexskip1 +bibliografiestijl voegt "bibliografiestijl" toe aan de TeX
skip-1 lijst, terwijl -khtmlnegeren voor, sterk vervangt de HTML negeerlijst door "pre" en
"sterk". De beschikbare lijsten zijn:

texskip1
TeX/LaTeX-commando's die een enkel argument bevatten dat niet op spelling moet worden gecontroleerd,
zoals "bibliografiestijl". De standaard is "end", "vspace", "hspace", "cite",
"ref", "parbox", "label", "input", "nocite", "include", "includeonly",
"documentstyle", "documentclass", "usepackage", "selectlanguage", "pagestyle",
"paginanummering", "afbreking", "pageref" en "psfig", plus "bibliografie" in sommige
installaties. Deze zoekwoorden zijn hoofdlettergevoelig.

texskip2
TeX/LaTeX-commando's die twee argumenten hebben die niet op spelling moeten worden gecontroleerd, zoals:
als "setlengte". De standaard is "rule", "setcounter", "addtocounter", "setlength",
"addtolength" en "settowidth". Deze zoekwoorden zijn hoofdlettergevoelig.

htmlnegeren
HTML-tags die tekst afbakenen die niet op spelling mag worden gecontroleerd tot het einde van de overeenkomst
label is bereikt. De standaard is "code", "samp", "kbd", "pre", "listing", en
"adres". Deze zoekwoorden zijn niet hoofdlettergevoelig. (Merk op dat de inhoud binnenin
HTML-tags, zoals HREF=, worden normaal niet gecontroleerd.)

htmlcontrole
Subvelden die zelfs binnen HTML-tags op spelling moeten worden gecontroleerd. De standaard is
"alt", zodat het ALT=-gedeelte van IMG-tags op spelling wordt gecontroleerd. deze trefwoorden
zijn niet hoofdlettergevoelig.

Alle bovenstaande trefwoordenlijsten kunnen ook worden gewijzigd door omgevingsvariabelen waarvan de namen
zijn hetzelfde als hierboven, behalve in hoofdletters, bijvoorbeeld TEXSKIP1. De -k schakelaaroverschrijvingen (of
voegt toe aan) de omgevingsvariabelen, en de omgevingsvariabelen overschrijven of voegen toe aan de
ingebouwde standaardinstellingen.

Het -F switch specificeert een extern deformatterprogramma. Dit programma zou gegevens moeten lezen
van de standaardinvoer en schrijf naar de standaarduitvoer. Het programma Dan moet je produceren
precies één teken van uitvoer voor elk teken van invoer, anders verliest ispell
synchronisatie en corrumpeert het uitvoerbestand. Witruimtetekens (vooral spaties,
tabs en nieuwe regels) en tekens die op spelling moeten worden gecontroleerd, moeten worden doorgegeven
onveranderd. Tekens die niet op spelling moeten worden gecontroleerd, moeten worden omgezet in spaties of
andere niet-woord karakters. Een HTML-deformatter kan bijvoorbeeld alle HTML-tags veranderen in:
spaties, en ook alle tekst die wordt gescheiden door tags zoals "code" of "kbd" leeg te maken.

Het -F switch is de geprefereerde manier om bestanden voor ispell te deformatteren, en zal uiteindelijk
de enige manier worden.

If ik spel wordt aangeroepen zonder bestandsnamen of modusschakelaars, komt het in een interactieve modus
ontworpen om de gebruiker de spelling van afzonderlijke woorden te laten controleren. Het programma herhaaldelijk
vraagt ​​op standaarduitvoer met "word:" en antwoordt met ofwel "ok" (mogelijk met
commentaar), "niet gevonden" of "hoe zit het met" gevolgd door een lijst met suggesties.

Het -l of "lijst" optie om ik spel wordt gebruikt om een ​​lijst met verkeerd gespelde woorden uit de
standaard invoer.

Het -a optie is bedoeld om te worden gebruikt vanuit andere programma's via een pijp. In deze modus,
ik spel drukt een eenregelig versie-identificatiebericht af en begint dan regels te lezen van:
invoer. Voor elke invoerregel wordt voor elk woord een enkele regel naar de standaarduitvoer geschreven
gecontroleerd op spelling op de regel. Als het woord is gevonden in het hoofdwoordenboek, of uw
persoonlijk woordenboek, dan bevat de regel alleen een '*'. Als het woord werd gevonden via
affix verwijderen, dan bevat de regel een '+', een spatie en het grondwoord. Als het woord was
gevonden door samengestelde vorming (aaneenschakeling van twee woorden, gecontroleerd door de -C
optie), dan bevat de regel alleen een '-'.

Als het woord niet in het woordenboek staat, maar er zijn bijna-ongevallen, dan bevat de regel een
'&', een spatie, het verkeerd gespelde woord, een spatie, het aantal bijna-ongevallen, het aantal
tekens tussen het begin van de regel en het begin van het verkeerd gespelde woord, a
dubbele punt, nog een spatie en een lijst met bijna-ongevallen, gescheiden door komma's en spaties.
Na de bijna-ongevallen (en alleen geïdentificeerd door het aantal bijna-ongevallen), als het woord
kan worden gevormd door (illegale) affixen toe te voegen aan een bekende wortel, is een lijst met voorgestelde
afleidingen, opnieuw gescheiden door komma's en spaties. Als er helemaal geen bijna-ongevallen zijn,
de lijnopmaak is hetzelfde, behalve dat de '&' is vervangen door '?' (en de bijna-miss
telling is altijd nul). De voorgestelde afleidingen naar aanleiding van de bijna-ongevallen staan ​​in de
het formulier:

[prefix+] root [-prefix] [-suffix] [+suffix]

(bijv. "re+fry-y+ies" om "refries" te krijgen") waarbij elke optionele PFX en sfx is een touwtje.
Ook wordt elke bijna-ongeval of gok met hetzelfde hoofdletter geschreven als het invoerwoord, tenzij zodanig
hoofdlettergebruik is illegaal; in het laatste geval wordt elke bijna-ongeval correct gekapitaliseerd
volgens het woordenboek.

Ten slotte, als het woord niet in het woordenboek voorkomt en er zijn geen bijna-ongevallen, dan
de regel bevat een '#', een spatie, het verkeerd gespelde woord, een spatie en de tekenverschuiving
vanaf het begin van de regel. Elke tekstinvoer wordt afgesloten met een
extra lege regel om aan te geven dat ik spel heeft de verwerking van de invoerregel voltooid.

Deze uitgangslijnen kunnen als volgt worden samengevat:

OKE: *

Wortel: +

Verbinding:
-

Missen: & : , , ..., , ...

Gok: ? 0 : , , ...

Geen: #

Bijvoorbeeld een dummy-woordenboek met de woorden "fray", "Frey", "fry" en "refried"
kan het volgende antwoord geven op het commando "echo 'frqy refries | ispell -a -m -d
./test.hash":
(#) Internationale Ispell-versie 3.0.05 (bèta), 08/10/91
& frqy 3 0: rafelen, frey, frituren
& refries 1 5: refried, re+fry-y+ies

Deze modus is ook geschikt voor interactief gebruik wanneer u de spelling van:
een enkel woord.

Het -A optie werkt net als -a, behalve dat als een regel begint met de tekenreeks
"&Include_File&", de rest van de regel wordt genomen als de naam van een bestand om verder te lezen
woorden. De invoer keert terug naar het oorspronkelijke bestand wanneer het include-bestand is uitgeput. inclusie
kan tot vijf diep worden genest. De sleutelreeks kan worden gewijzigd met de omgeving
variabele INCLUDE_STRING (de ampersands, indien aanwezig, moeten worden opgenomen).

Wanneer in de -a mode, ik spel accepteert ook regels van enkele woorden die voorafgegaan worden door een van
'*', '&', '@', '+', '-', '~', '#', '!', '%', '''' of '^'. Een regel die begint met '*' vertelt
ik spel om het woord in het woordenboek van de gebruiker in te voegen (vergelijkbaar met het I-commando). een lijn
beginnend met '&' vertelt ik spel om een ​​geheel kleine versie van het woord in te voegen in de
gebruikerswoordenboek (vergelijkbaar met het U-commando). Een regel die begint met '@' veroorzaakt ik spel naar
accepteer dit woord in de toekomst (vergelijkbaar met het A-commando). Een regel die begint met '+',
onmiddellijk gevolgd door tex or nroff zal veroorzaken ik spel om toekomstige invoer te ontleden volgens de
syntaxis van die formatter. Een regel die uitsluitend uit een '+' bestaat, wordt geplaatst ik spel in
TeX/LaTeX-modus (vergelijkbaar met de -t optie) en '-' retourneert ik spel naar nroff/troff-modus (maar
deze commando's zijn verouderd). Het tekenreekstype is echter: geen veranderd; de '~'
Hiervoor moet het commando worden gebruikt. Een regel die begint met '~' veroorzaakt ik spel intern instellen
parameters (in het bijzonder het standaard tekenreekstype) op basis van de opgegeven bestandsnaam
in de rest van de lijn. (Een bestandsachtervoegsel is voldoende, maar de periode moet worden opgenomen.
In plaats van een bestandsnaam of achtervoegsel, mag een unieke naam, zoals vermeld in het taalaffixbestand,
worden opgegeven.) Het ontleden van de formatter is echter geen veranderd; het '+'-commando moet . zijn
gebruikt om de formatter te wijzigen. Een regel met het voorvoegsel '#' zorgt ervoor dat het persoonlijke woordenboek
gered worden. Een regel voorafgegaan door '!' gaat aan kortom modus (zie hieronder), en een lijn
voorafgegaan door '%' zal terugkeren ik spel naar de normale (niet-korte) modus. Een regel voorafgegaan door '''
schakelt de uitgebreide correctiemodus in (zie hieronder); deze modus kan alleen worden uitgeschakeld door:
de beknopte modus inschakelen met '%'.

Elke invoer die volgt op de prefix-tekens '+', '-', '#', '!', '%' of ''' wordt genegeerd, omdat
is elke invoer die volgt op de bestandsnaam op een '~'-regel. Spellingcontrole van regels toestaan
beginnend met deze tekens, een regel die begint met '^' heeft dat teken verwijderd
voordat het wordt doorgegeven aan de spellingcontrolecode. Het wordt aanbevolen dat programmatische
interfaces prefixen elke datalijn met een uparrow om zichzelf te beschermen tegen toekomstige
veranderingen ik spel.

Om deze samen te vatten:

* Toevoegen aan persoonlijk woordenboek

@ Accepteer woord, maar laat uit woordenboek

# Bewaar huidig ​​persoonlijk woordenboek

~ Stel parameters in op basis van bestandsnaam

+ Ga naar de TeX-modus

- Verlaat de TeX-modus

! Ga naar beknopte modus

% Verlaat de beknopte modus

` Ga naar de uitgebreide correctiemodus

^ Spellingcontrole rest van regel

In kortom mode, ik spel zal geen regels afdrukken die beginnen met '*', '+' of '-', die allemaal
juiste woorden aangeven. Dit verbetert de loopsnelheid aanzienlijk tijdens het rijden
programma zal de juiste woorden sowieso negeren.

In uitgebreide-correctie mode, ik spel bevat het oorspronkelijke woord direct na de
indicatorteken in uitvoerregels die beginnen met '*', '+' en '-', wat het vereenvoudigt
interactie voor sommige programma's.

Het -s optie is alleen geldig in combinatie met de -a or -A opties, en alleen op BSD-
afgeleide systemen. Indien gespecificeerd, ik spel stopt vanzelf met een SIGTSTP signaal na elke
invoerlijn. Het zal niet meer invoer lezen totdat het een ontvangt VOLGENDE signaal. Dit zou
handig zijn voor handshaking met bepaalde teksteditors.

Het -f optie is alleen geldig in combinatie met de -a or -A opties. Als -f is gespecificeerd,
ik spel zal zijn resultaten naar het opgegeven bestand schrijven, in plaats van naar de standaarduitvoer.

Het -v optie oorzaken ik spel om de huidige versie-identificatie op de standaard af te drukken
uitgang en uitgang. Als de schakelaar wordt verdubbeld, ik spel zal ook de opties afdrukken die het was
mee samengesteld.

Het -c, -e[1-5] En -D opties van ik spel, zijn in de eerste plaats bedoeld voor gebruik door de munchlist
shell-script. De -c schakelaar zorgt ervoor dat een lijst met woorden uit de standaardinvoer wordt gelezen.
Voor elk woord wordt een lijst met mogelijke stamwoorden en affixen naar de standaard geschreven
uitvoer. Sommige van de basiswoorden zijn illegaal en moeten uit de uitvoer worden gefilterd door:
andere middelen; de munchlist script doet dit. Als voorbeeld het commando:

echo HANG | isspell -c

produceert:

MOEDER ZOWEL/R BEIDE/R

Het -e schakelaar is het omgekeerde van -c; het breidt affix-vlaggen uit om een ​​lijst met woorden te produceren.
Bijvoorbeeld het commando:

echo BEIDE/R | isspell -e

produceert:

BEIDE MOEDER

Er kan ook een optioneel uitbreidingsniveau worden gespecificeerd. Een niveau van 1 (-e1) is hetzelfde als -e
alleen. Een niveau van 2 zorgt ervoor dat de originele root/affix-combinatie wordt toegevoegd aan de
lijn:

BEIDE/R BEIDE MOEDER

Een niveau van 3 zorgt ervoor dat meerdere regels worden uitgevoerd, één voor elk gegenereerd woord, met de
originele root/affix-combinatie gevolgd door het woord dat het creëert:

BEIDE/R BEIDE
BEIDE/R HAARD

Een niveau van 4 zorgt ervoor dat een getal met drijvende komma wordt toegevoegd aan elk van de lijnen van niveau 3,
het geven van de verhouding tussen de lengte van de wortel en de totale lengte van alle gegenereerde
woorden inclusief de wortel:

BEIDE/R BEIDE 2.500000
BEIDE/R HAARD 2.500000

Een niveau van 5 zorgt ervoor dat meerdere regels worden uitgevoerd, één voor elk gegenereerd woord. Als de
Het gegenereerde woord heeft geen affixen gebruikt, de regel is precies dat woord. Als een of meer
affixen zijn gebruikt, zijn de oorspronkelijke wortel en de daadwerkelijk gebruikte affixen afgedrukt, samen met
een plusteken; dan wordt het gegenereerde woord afgedrukt:

BEIDE
BEIDE + R MOEILIJK

Ten slotte -D vlag zorgt ervoor dat de affix-tabellen uit het woordenboekbestand worden gedumpt naar
standaard uitvoer.

Ik spel is op de hoogte van de juiste hoofdletters van woorden in het woordenboek en in uw
persoonlijk woordenboek. Evenals het herkennen van woorden die met een hoofdletter moeten worden geschreven (bijv. George)
en woorden die uit hoofdletters moeten bestaan ​​(bijv. NASA), kan het ook woorden aan met "ongebruikelijk"
hoofdlettergebruik (bijv. "ITCorp" of "TeX"). Als een woord onjuist met een hoofdletter wordt geschreven, wordt de lijst
van de mogelijkheden zullen alle aanvaardbare hoofdletters bevatten. (Meer dan een
hoofdlettergebruik kan acceptabel zijn; mijn woordenboek vermeldt bijvoorbeeld zowel "ITCorp" als
"ITcorp".)

Normaal gesproken zorgt deze functie niet voor verrassingen, maar er is één omstandigheid waarin u:
op de hoogte moeten zijn. Als u "I" gebruikt om een ​​woord aan uw woordenboek toe te voegen dat zich op de
begin van een zin (bijv. het eerste woord van deze alinea als "normaal" niet in
het woordenboek), wordt het gemarkeerd als "hoofdletters vereist". Een volgend gebruik van
dit woord zonder hoofdletters (bijv. het geciteerde woord in de vorige zin) wordt
beschouwd als een spelfout door ik spel, en het zal de versie met hoofdletter voorstellen. Je moet
vergelijk vervolgens de werkelijke spelling met het oog en typ vervolgens "I" om de niet-hoofdletters toe te voegen
variant op uw persoonlijke woordenboek. U kunt dit probleem voorkomen door "U" te gebruiken om de . toe te voegen
oorspronkelijke woord, in plaats van "ik".

De regels voor hoofdlettergebruik zijn als volgt:

(1) Elk woord mag in hoofdletters verschijnen, zoals in kopjes.

(2) Elk woord dat in het woordenboek in kleine letters staat, mag ofwel in
kleine letters of hoofdletters (zoals aan het begin van een zin).

(3) Elk woord met een "grappig" hoofdlettergebruik (dwz het bevat beide hoofdletters en er is
een hoofdletter naast de eerste) moet precies zoals in het woordenboek voorkomen,
behalve zoals toegestaan ​​door regel (1). Als het woord acceptabel is in kleine letters, is het
moet dus voorkomen in een woordenboekinvoer.

buildhash
Het buildhash programma bouwt gehashte woordenboekbestanden voor later gebruik door ik spel. De rauwe
woordenlijst (met affix-vlaggen) wordt gegeven in dict-bestand, en de affix-vlaggen worden gedefinieerd door
affix-bestand. De gehashte uitvoer wordt geschreven naar hash-bestand. De formaten van de twee invoer
bestanden worden beschreven in ik spel(5). De -s (stille) optie onderdrukt de gebruikelijke status
berichten die naar het standaardfoutapparaat worden geschreven.

munchlist
Het munchlist shellscript wordt voornamelijk gebruikt om de grootte van woordenboekbestanden te verkleinen
persoonlijke woordenboekbestanden. Het is ook in staat om woordenboeken uit verschillende
bronnen. het gegeven bestanden worden gelezen (standaard invoer als er geen argumenten zijn opgegeven), teruggebracht tot
een minimale set wortels en affixen die overeenkomen met dezelfde lijst met woorden, en geschreven naar
standaard uitvoer.

Invoer voor munchlist bevat onbewerkte woorden (bijv. uit uw persoonlijke woordenboekbestanden) of
combinaties van root en affix (waarschijnlijk gegenereerd in eerdere munchlist-runs). Elk woord of
root/affix-combinatie moet op een aparte regel staan.

Het -D (debug) optie laat tijdelijke bestanden rond onder standaardnamen in plaats van
door ze te verwijderen, zodat het script kan worden opgespoord. Waarschuwing: op een systeem met meerdere gebruikers is dit
kan een beveiligingslek zijn. Om mogelijke vernietiging van belangrijke bestanden te voorkomen, mag u de
script als root en stel MUNCHDEBUGDIR in op de naam van een map waartoe alleen jij toegang hebt.

Het -v (uitgebreide) optie zorgt ervoor dat voortgangsberichten worden gerapporteerd aan stderr, zodat u niet krijgt
zenuwachtig dat munchlist heeft gehangen.

Indien de -s (strip) optie is opgegeven, woorden die in de opgegeven hash-bestand zijn
verwijderd uit de woordenlijst. Dit kan handig zijn bij persoonlijke woordenboeken.

Het -l optie kan worden gebruikt om een ​​alternatief op te geven affix-bestand voor het kauwen van woordenboeken in
andere talen dan Engels.

Het -c optie kan worden gebruikt om woordenboeken te converteren die met een oudere affix zijn gemaakt
bestand, zonder het risico dat er per ongeluk onbedoelde affix-combinaties in de
woordenboek.

Het -T Met deze optie kunnen woordenboeken worden geconverteerd naar een canoniek tekenreeksformaat.
Het opgegeven achtervoegsel wordt opgezocht in het affix-bestand (-l schakelaar) om de string te bepalen-
tekenformaat gebruikt voor het invoerbestand; de output gebruikt altijd de canonieke string-
teken formaat. Een woordenboek dat is verzameld uit TeX-bronbestanden kan bijvoorbeeld zijn:
geconverteerd naar canoniek formaat door op te geven -T tex.

Het -w optie wordt doorgegeven aan ik spel.

vindaffix
Het vindaffix shellscript is een hulpmiddel voor schrijvers van nieuwe taalbeschrijvingen bij het kiezen
hecht. Het gegeven woordenboek bestanden (standaard invoer indien geen gegeven) worden onderzocht op
mogelijke voorvoegsels (-p schakelaar) of achtervoegsels (-s schakelaar, de standaardinstelling). Elke algemeen-
voorkomende affix wordt weergegeven samen met een telling van het aantal keren dat het voorkomt en een
schatting van het aantal bytes dat zou worden opgeslagen in een woordenboek-hashbestand als dat zo was
toegevoegd aan de taaltabel. Alleen affixen die juridische wortels genereren (te vinden in de
originele invoer) worden weergegeven.

Als de optie "-c" niet wordt gegeven, hebben de uitvoerregels het volgende formaat:

strip/toevoegen/tellen/bytes

WAAR strip is de tekenreeks die moet worden ontdaan van een hoofdwoord voordat de . wordt toegevoegd
bevestigen, toevoegen is de affix die moet worden toegevoegd, tellen is een telling van het aantal keren dat dit
strip/toevoegen combinatie verschijnt, en bytes is een schatting van het aantal bytes dat zou kunnen
worden opgeslagen in het onbewerkte woordenboekbestand als deze combinatie wordt toegevoegd aan het affix-bestand. De
veldscheidingsteken in de uitvoer zal het tabteken zijn dat wordt gespecificeerd door de -t schakelaar; de
standaard is een schuine streep ("/").

Indien de -c ("schone uitvoer") optie wordt gegeven, het uiterlijk van de uitvoer wordt visueel gemaakt
schoner (maar moeilijker te nabewerken) door het te wijzigen in:

-strip+toevoegen Graaf bytes

WAAR strip, toevoegen, tellen en bytes zijn als voorheen, en staat voor het ASCII-tabblad
karakter.

De methode die wordt gebruikt om mogelijke affixen te genereren, genereert ook langere affixen die:
gemeenschappelijke headers of trailers. De twee woorden "mot" en "moeder" genereren bijvoorbeeld:
niet alleen de voor de hand liggende vervanging "+er" maar ook "-h+her" en "-th+ther" (en mogelijk
nog langere, afhankelijk van de waarde van Min). Om te voorkomen dat de uitvoer onoverzichtelijk wordt met:
dergelijke affixen, elk affix-paar dat een gemeenschappelijke kop deelt (of, voor voorvoegsels, trailer)
string langer dan Elim tekens (standaard 1) worden onderdrukt. Misschien wilt u instellen
"elim" naar een waarde groter dan 1 als uw taal tekenreeksen heeft; meestal de behoefte
want deze parameter wordt duidelijk wanneer je de uitvoer van je vindaffix rennen.

Normaal gesproken worden de affixen gesorteerd volgens de schatting van het aantal opgeslagen bytes. De -f schakelaar
kan worden gebruikt om de affixen te sorteren op frequentie van voorkomen.

Om ruimte in het uitvoerbestand te besparen, worden affixen die minder dan 10 keer voorkomen, geëlimineerd; dit
limiet kan worden gewijzigd met de -l schakelaar. De -M schakelaar specificeert een maximale bevestigingslengte
(standaard 8). Affixen die langer zijn dan dit worden niet gerapporteerd. (Hiermee wordt tijdelijk bespaard)
schijfruimte en zorgt ervoor dat het script sneller wordt uitgevoerd.)

Affixen die stammen genereren die korter zijn dan 3 karakters worden onderdrukt. (Een stengel is de
woord na de strip string is verwijderd, en voordat de toevoegen string is toegevoegd.)
Dit vermindert zowel de looptijd als de grootte van het uitvoerbestand. Deze limiet kan zijn:
veranderd met de -m schakelaar. De minimale steellengte mag alleen op 1 worden ingesteld als u een
lot vrije tijd en schijfruimte (in het bereik van vele dagen en honderden megabytes).

Het vindaffix script vereist een niet-lege veldscheidingsteken voor intern gebruik.
Normaal gesproken is dit teken een schuine streep ("/"), maar als de schuine streep verschijnt als een teken in de
invoerwoordenlijst, een ander teken kan worden opgegeven met de -t schakelaar.

Ispell-woordenboeken moeten worden uitgebreid voordat ze worden ingevoerd vindaffix; in aanvulling op,
tekens die niet in het Engelse alfabet (indien aanwezig) staan, moeten worden vertaald naar
kleine letters.

probeeraffix
Het probeeraffix shellscript wordt gebruikt om de effectiviteit van een voorgesteld voorvoegsel te schatten (-p
schakelaar) of achtervoegsel (-s schakelaar, de standaard) met een gegeven uitgebreid-bestand. Slechts één affix kan
beproefd worden bij elke uitvoering van probeeraffix, hoewel er meerdere argumenten kunnen worden gebruikt om
beschrijf verschillende vormen van dezelfde affix-vlag (bijv. de D vlag voor Engels kan beide toevoegen
D or ED afhankelijk van of er al een trailing E aanwezig is). Elk woord in de uitgebreide
woordenboek dat eindigt (of begint) met het gekozen achtervoegsel (of voorvoegsel) heeft dat achtervoegsel
(voorvoegsel) verwijderd; het woordenboek wordt vervolgens doorzocht op basiswoorden die overeenkomen met de gestripte
woord. Normaal gesproken worden alle overeenkomende wortels naar de standaarduitvoer geschreven, maar als de -c (Graaf)
vlag wordt gegeven, wordt alleen een statistische samenvatting van de resultaten geschreven. De gegeven statistieken
zijn een telling van woorden waarop de affix mogelijk van toepassing is en een schatting van het aantal
woordenboekbytes die een vlag die de affix gebruikt, zou opslaan. De schatting zal hoog zijn als de
flag genereert woorden die momenteel worden gegenereerd door andere affix-vlaggen (bijvoorbeeld in het Engels,
zwemmers kan worden gegenereerd door ofwel bad/X or bader/S).

Het woordenboekbestand, uitgebreid-bestand, moet al worden uitgevouwen (met de -e schakelaar uit
ik spel) en gesorteerd, en dingen werken meestal het beste als hoofdletters zijn gevouwen naar
lager met 'tr'.

Het bevestigen argumenten zijn dingen die uit het woordenboekbestand moeten worden verwijderd om een ​​proef te produceren
wortels: voor Engels, met (voorvoegsel) en ING (achtervoegsel) zijn voorbeelden. De toevoeging delen van de
argument zijn letters die van de wortel zouden zijn verwijderd voordat de affix werd toegevoegd.
Bijvoorbeeld, in het Engels de affix ING normaal strippen e voor woorden die eindigen op die letter
(Bv als wordt smaak) zodat we kunnen uitvoeren:

probeer ing+e . te bevestigen

beide gevallen te dekken.

Alle shellscripts bevatten aan het begin documentatie als commentaar; soms
deze opmerkingen bevatten nuttige informatie die buiten het bestek van deze handleiding valt.

Het is mogelijk om te installeren ik spel op een zodanige manier dat alleen ASCII-bereiktekst wordt ondersteund als
gewenst.

icombineren
Het icombineren programma is een hulp voor munchlist. Het leest een lijst met woorden in het woordenboek
formaat (roots plus vlaggen) van de standaardinvoer, en produceert een beperkte lijst op standaard
output die gemeenschappelijke wortels combineert die gevonden zijn op aangrenzende items. Identieke wortels die hebben
verschillende vlaggen hebben hun vlaggen gecombineerd, en wortels die verschillende . hebben
hoofdletters worden gecombineerd op een manier die alleen belangrijke hoofdletters behoudt
informatie. de optionele aff-bestand specificeert een taalbestand dat het karakter definieert
gebruikte sets en de betekenis van de verschillende vlaggen. De -T schakelaar kan worden gebruikt om te selecteren:
tussen alternatieve tekenreekstypes door een dummy-achtervoegsel te geven dat kan worden gevonden in an
altstringtype uitspraak. De -w schakelaar is identiek aan dezelfde schakelaar in ik spel.

ik doe mee
Het ik doe mee programma is een herimplementatie van mee(1) die omgaat met lange regels en 8-bit
tekens correct. De -s schakelaar geeft aan dat de sorteren(1) programma gebruikt om voor te bereiden
de invoer om ik doe mee gebruikt getekende vergelijkingen op 8-bits karakters; de -u schakelaar specificeert:
dat sorteren(1) gebruikt niet-ondertekende vergelijkingen. Alle andere opties en gedragingen van mee(1) zijn
zo exact mogelijk gedupliceerd op basis van de handleiding, behalve dat ik doe mee zal niet
behandel newline als een veldscheidingsteken. Zie de mee(1) handleiding voor meer informatie.

MILIEU


WOORDENBOEK
Standaard woordenboek om te gebruiken, zo nee -d vlag wordt gegeven.

ISPELL_CHARSET
Formattertype of te gebruiken tekencodering, als er geen is gekozen door een vlagoptie.

WOORDENLIJST
Bestandsnaam persoonlijk woordenboek

INCLUDE_STRING
Code voor bestandsopname onder de -A optie

TMPDIR Directory gebruikt voor enkele tijdelijke bestanden van munchlist

MUNCHDEBUGDIR
Directory die wordt gebruikt om de uitvoer van munchlists te bewaren -D optie.

TEXSKIP1
Lijst met TeX-trefwoorden met één argument die: ik spel zou moeten negeren.

TEXSKIP2
Lijst met TeX-trefwoorden met twee argumenten die: ik spel zou moeten negeren.

HTMLIGNORE
Lijst met HTML-sleutelwoorden die tekst afbakenen die niet op spelling moet worden gecontroleerd.

HTMLCHECK
Lijst met HTML-velden die altijd op spelling moeten worden gecontroleerd, zelfs binnen een tag.

Gebruik icombine online met onworks.net-services


Ad


Ad