Aceasta este comanda dictfmt care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS
PROGRAM:
NUME
dictfmt - formatează o bază de date de dicționar de protocol DICT
REZUMAT
dictfmt -c5|-t|-e|-f|-h|-j|-p [Opțiuni] nume de bază
dictfmt -i|-I [Opțiuni]
DESCRIERE
dictfmt ia un dosar, FIŞIER, pe stdin și creează o bază de date de dicționar numită
basename.dict, care respectă protocolul DICT. De asemenea, creează un fișier index numit
nume de bază.index. În mod implicit, indexul este sortat în funcție de localitatea C și numai
caracterele alfanumerice și spațiile sunt folosite în sortare, totuși aceasta poate fi schimbată cu
opțiunile --locale și --allchars. ( nume de bază este de obicei ales pentru a corespunde cu
numele de bază al FILE , dar acest lucru nu este obligatoriu.)
Cu excepția cazului în care baza de date este extrem de mică, este foarte recomandat acest lucru nume de bază.dict be
comprimat cu /usr/bin/dictzip pentru a crea nume de bază.dict.dz. (dictzip este inclus în
dictd pachet sursă.)
FILE poate fi în oricare dintre cele mai multe formate descrise de opțiunile de format -c5, -t, -e, -f,
-h, -j, -p, -i sau -I. Trebuie oferită exact una dintre aceste opțiuni.
dictfmt adaugă mai multe antete la fișierul .dict. Antetul 00-database-url oferă
valoarea opțiunii -u ca adresa URL a site-ului de pe care a fost baza de date inițială
obținut. Antetul 00-database-short oferă valoarea opțiunii -s ca nume scurt
a dicționarului. (Acest „nume scurt” este numele de identificare dat de „dict-D”
opțiunea.) Dacă opțiunile -u și/sau -s sunt omise, aceste valori vor fi afișate ca
„necunoscut”, care este nedorit pentru o bază de date distribuită public.
Data conversiei (formatării) este dată în antetul 00-database-info. Tot textul în
fișierul de intrare înainte de primul cuvânt (așa cum este definit de formatarea adecvată
opțiunea) este atașată la acest antet. Tot textul din fișierul de intrare după un cuvânt, în sus
la următorul cuvânt principal, este copiat neschimbat în fișierul .dict.
FORMATAREA OPŢIUNI
-c5 FILE este formatat cu cuvinte de cap precedat de 5 sau mai multe caractere de subliniere (_)
și o linie goală. Tot textul până la următorul cuvânt principal este considerată definiția.
Orice caractere „@” de început sunt eliminate, dar fișierul rămâne neschimbat.
Această opțiune a fost scrisă pentru a formata CIA WORLD FACTBOOK 1995.
-t Opțiunile -c5, --without-info și --without-headword sunt implicite. Utilizați această opțiune,
dacă o bază de date de intrare provine din dictanformat utilitate.
-e FILE este în format html, cu cuvânt principal etichetat ca îndrăzneț. ( cuvânt principal - )
Această opțiune a fost scrisă pentru a formata DICȚIONARUL BIBLIC AL LUI EASTON 1897. O intrare tipică
din Easton este:
Abagtha -
unul dintre cei șapte eunuci din curtea lui Ahașveroș (Estera 1:10; 2:21).
Acesta este convertit în:
Abagtha
unul dintre cei șapte eunuci din curtea lui Ahașveroș (Estera 1:10; 2:21).
Titlul „ este omis, iar cuvânt principal „Abagtha” este indexat.
NOTĂ: Această opțiune trebuie utilizată cu prudență. Îndepărtează mai multe etichete html
(suficient pentru a formata Easton corect), dar nu toate. Makefile care a fost inițial
scris în format dict-easton folosește scripturi sed pentru a modifica anumite referințe încrucișate
Etichete. Poate fi necesar să transferați fișierul de intrare printr-un script sed sau să piratați fișierul
sursa dictfmt pentru a formata corect alte baze de date html.
-f FILE este formatat cu cuvinte de cap începând din coloana 0, cu definiția
a indentat cel puțin un spațiu (sau caracter de tabulație) pe rândurile următoare. al treilea linie
pornire in coloană 0 is luate as il primul cuvânt principal , și primele două rânduri
începând cu coloana 0 sunt tratate ca parte a antetului 00-database-info. Acest
opțiunea a fost scrisă pentru a formata FOLDOC
-h FILE este formatat cu cuvinte de cap începând cu coloana 0, urmată de o virgulă,
cu definiția continuând pe aceeași linie. Tot textul înainte de primul single
linia de caractere este inclusă în antetul 00-database-info, iar liniile cu unul singur
caracterele sunt omise din fișierul .dict. primul cuvânt principal is on il linie
următor il primul singur caracter linia. cuvânt principal este indexat; textul lui
fisierul nu este schimbat. Această opțiune a fost scrisă pentru a formata NUMELE BIBLICE LUI HITCHCOCK
DICŢIONAR.
-j FILE este formatat cu cuvinte de cap începând cu col 0, încadrat în două puncte, urmat de
definitia. Colonurile care înconjoară cuvânt principal sunt eliminate, iar cuvânt principal
este indexat. Liniile care încep cu „*”, „=” sau „-” sunt de asemenea eliminate. Tot textul
înainte ca primul cuvânt de cap să fie inclus în anteturi. Această opțiune a fost scrisă la
formatați FIȘIERUL JARGON.
NOTĂ: Unele versiuni recente ale FIȘIERULUI JARGON aveau trei spații libere inserate înainte de
primele două puncte la fiecare cuvânt principal. Acestea trebuie eliminate înainte de procesare cu
dictfmt. (s-au folosit scripturi sed în acest scop. scripturi ed, awk sau perl
sunt de asemenea posibile.)
-p FILE este formatat cu „%h” în coloana 0, urmat de un gol, urmat de
cuvânt principal, urmată opțional de o linie care conține „%d” în coloana 0
definiția începe pe următoarea linie. Prima linie care începe cu ´%h´ și oricare
liniile care încep cu „%d” sunt eliminate din fișierul .dict, iar „%h” sunt eliminate din
în fața cuvântului principal. Tot textul înainte de primul cuvânt este inclus în
anteturi. al doilea linie început '%h' is luate as il primul cuvânt principal.
Această opțiune a fost scrisă pentru a formata baza de date a elementelor lui Jay Kominek.
-i -I Aceste două opțiuni sunt diferite de toate celelalte opțiuni de formatare. Sunt
destinat să recurgă (conform dictd cerință) un fișier .index dat pe stdin.
Adică fișierul .dict nu este generat deloc. Se face doar recurgerea. Trei- sau
este de așteptat intrare .index pe patru coloane. -i așteaptă offset zecimal și lungime,
în timp ce -I le așteaptă în format base64.
OPŢIUNI
-u url Specifică adresa URL a site-ului de la care a fost obținută baza de date brută. Dacă aceasta
este specificată opțiunea, vor fi 00-database-url headword și definiția corespunzătoare
ignorat.
-s nume
Specifică numele și, opțional, versiunea și data bazei de date. (Dacă
aceasta conține spații, trebuie citată.) Dacă această opțiune este specificată,
00-database-headword scurt și definiția corespunzătoare vor fi ignorate.
-L afișați informații despre licență și drepturi de autor
-V afișează informații despre versiune
-D ieșiți informații de depanare
--Ajutor afișează un mesaj de ajutor
--locale localizare
Specifică localitatea utilizată pentru sortare. Dacă nu este specificată nicio locație, localitatea „C”.
este folosit. Pentru utilizarea modului UTF-8, este necesar --utf8.
--8 biți generează baza de date în modul de 8 biți, vezi --locale varianta de asemenea.
Notă: Această opțiune este depreciată. Utilizați-l pentru a crea dicționare pe 8 biți (non-UTF8).
numai. Pentru a crea dicționarul UTF-8, utilizați --utf8 opțiune în schimb.
--utf8 Dacă este specificat, baza de date UTF-8 este creată.
--allchars
Specifică faptul că toate caracterele trebuie utilizate pentru căutare, numai în mod implicit
caracterele alfabetice, numerice și spațiile sunt puse în fișierul .index și, prin urmare, sunt
folosit în căutare. Creează intrarea specială 00-database-allchars.
--caz sensibil
face căutarea sensibilă la majuscule și minuscule. Creează intrarea specială 00-database-case-
sensibil.
--headword-separator sep
setează separatorul de cuvinte, care permite mai multor cuvinte să aibă același lucru
definiție. De exemplu, dacă este dat „--headword-separator %%%” și intrarea
fișierul conține „toamna%%%toamna”, atât „toamna” cât și „toamna” vor fi indexate ca
cuvinte cheie, cu aceeași definiție.
--index-data-separator sep
setează indexul/separatorul de date, care permite să setați prima și a patra coloană
a fișierului .index în mod independent. Aceasta este prima coloană care poate fi tratată ca un index
coloana (unde caută comanda MATCH) și a patra coloană ca rezultat
(unde MECIUL primește ca lucrurile să fie returnate), iar acestea (prima și a 1-a coloană) sunt
complet independente unele de altele. Valoarea implicită pentru acest separator este
Simbol ASCII „ \034”.
--break-headwords
mai multe cuvinte vor fi scrise pe rânduri separate în fișierul .dict. Pentru utilizare
cu '--headword-separator.
--index-keep-orig
Când este specificat --utf-8, cuvintele de antet sunt caractere minuscule și non-alfanumerice
sunt eliminate din acesta înainte de a salva în fișierul .index pentru a simplifica căutarea.
Când este utilizată opțiunea --index-keep-orig, este creată a patra coloană (dacă este necesar) în
.index și conține un cuvânt original care este returnat de comanda MATCH.
Această opțiune poate fi utilă pentru a preveni conversia „AT&T” în „ATT” sau pentru a menține corect
substantive cu prima literă majusculă.
--fără-headword
cuvintele nu vor fi incluse în fișierul .dict
--fără-antet
antetul nu va fi copiat în intrarea de informații DB
--fără-url
Adresa URL nu va fi copiată în intrarea de informații DB
--fără-timp
ora creării nu va fi copiată în intrarea de informații DB
--fără-ver
În mod implicit dictfmt creează o intrare specială 00-database-dictfmt-XYZ care conține
(în fișierul .dict) versiunea dictfmt în format dictfmt-XYZ Această opțiune suprimă
acest.
--fara-informatii
Intrarea de informații DB nu va fi creată. Acest lucru poate fi util dacă 00-database-info headword
este așteptat de la stdin (dictunformat îl scoate).
--coloane coloane
În mod implicit dictfmt împachetează șirurile de caractere citite din stdin în 72 de coloane. Această opțiune
modifică această implicită. Dacă este setat la zero sau o valoare negativă, înfășurarea este dezactivată.
--strategie-default strategie
Setează strategia de căutare implicită pentru baza de date. Va fi folosit în loc de
strategia '.'. Intrare specială 00-database-default-strategy este creat pentru aceasta
scop. Această opțiune poate fi utilă, de exemplu, pentru dicționarele care conțin
în principal fraze, dar cuvintele unice. În orice caz, utilizați această opțiune dacă sunteți
absolut sigur ce faci.
--mime-header mime_header
Când clientul trimite OPȚIUNE MIMA comanda la dictd , definiții găsite în aceasta
baza de date sunt predate de antetul MIME specificat. Creează intrarea specială
00-database-mime-header.
CREDITE
dictfmt a fost scris de Rik Faith (credință@cs.unc.edu) ca parte a pachetului dict-misc.
dictfmt este distribuit în conformitate cu termenii licenței publice generale GNU. Dacă ai nevoie să
distribuiți în alți termeni, scrieți autorului.
Utilizați dictfmt online folosind serviciile onworks.net