Aceasta este comanda grind care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS
PROGRAM:
NUME
grind - procesează fișierele lexicograf WordNet
REZUMAT
pisa [ -v ] [ -s ] [ -Lfișier jurnal ] [ -a ] [ -d ] [ -i ] [ -o ] [ -n ] nume de fișier [
nume de fișier... ]
DESCRIERE
pisa() procesează fișierele de lexicograf WordNet, producând fișiere de bază de date adecvate pentru utilizare
cu codul de căutare și interfață WordNet și alte aplicații. Sintacticul și
se verifică integritatea structurală a fișierelor de intrare. Avertismentele și erorile sunt raportate prin
stderr și un jurnal de rulare este produs stdout. O bază de date este generată numai dacă există
nu sunt erori.
Intrare Fişiere
Fișierele de intrare corespund categoriilor sintactice implementate în WordNet - substantiv, verb,
adjectiv și adverb. Fiecare fișier lexicograf de intrare constă dintr-o listă de seturi de sinonime
(synsets) pentru o parte a discursului. Deși sintaxa de bază a sinsetului este aceeași pentru toate
părțile de vorbire, unele părți ale sintaxei se aplică doar unei anumite părți de vorbire.
Vedea wninput(5WN) pentru o descriere a formatului fișierului de intrare.
Fiecare nume de fișier specificat este de forma:
caii de acces/post.sufix
Unde caii de acces este opțional și post este fie substantiv, verb, adj or adv. sufix Poate fi folosit
pentru a separa grupuri de synset-uri în fișiere diferite, de exemplu substantiv.animal și
substantiv.plantă. Unul sau mai multe fișiere de intrare, în orice combinație de categorii sintactice, pot fi
specificat. Vedea nume de lex(5WN) pentru o listă a fișierelor de lexicograf utilizate pentru a construi fișierul
baza de date WordNet completă.
producție Fişiere
pisa() produce următoarele fișiere de ieșire:
┌────────────┬──────────────────────────────────── ────┐
│ Filename │ Descriere │
├────────────┼──────────────────────────────────── ────┤
│index.post │ Fișier index pentru fiecare categorie sintactică │
│de date.post │ Fișier de date pentru fiecare categorie sintactică │
│index.sens │ Indicele de simț │
└────────────┴──────────────────────────────────── ────┘
Vedea wndb(5WN) pentru o descriere a formatelor de fișiere ale bazei de date.
De fiecare data pisa() este rulat, orice fișiere de bază de date existente sunt suprascrise cu baza de date
fișierele generate din fișierele de intrare specificate. Dacă nu există fișiere de intrare dintr-o sintactică
sunt specificate, fișierele de bază de date corespunzătoare nu sunt suprascrise.
Sens Numere
Simțurile sunt în general ordonate de la cel mai la cel mai puțin frecvent utilizate, cu cele mai frecvente
sens numerotat 1. Frecvența utilizării este determinată de numărul de etichete ale unui simț
în diferitele texte de concordanţă semantică. Urmează simțurile care nu sunt etichetate semantic
simţurile ordonate într-o ordine arbitrară. Rețineți că această comandă este doar o estimare
bazat pe utilizarea într-un corpus mic.
tagsense_cnt câmp pentru fiecare intrare din index.post fișierele indică câte dintre
simțurile din listă au fost etichetate.
cntlist fișierul furnizat împreună cu baza de date listează de câte ori este etichetat fiecare simț
în concordanţele semantice. pisa() folosește datele de la cntlist a ordona simțurile de
fiecare cuvânt. Cand index.post sunt generate fișiere, the synset_offsets sunt ieșite în sens
ordinea numerelor, cu sensul 1 primul în listă. Simțuri cu același număr de semantice
etichetelor li se atribuie numere de sens unice, dar consecutive. WordNet ÎNSCRIERI căutare
afișează toate sensurile cuvântului specificat, în toate categoriile sintactice și indică
care dintre simţuri sunt reprezentate în textele etichetate semantic.
OPŢIUNI
-v Verificați integritatea intrării fără a genera baza de date.
-s Suprimați generarea de mesaje de avertizare. Obișnuit pisa se rulează cu asta
opțiune până când toate erorile sintactice și structurale sunt corectate de la
mesajele de avertizare pot face dificilă identificarea mesajelor de eroare.
-Lfișier jurnal Scrieți toate mesajele către fișier jurnal în loc de stderr.
-a Generați un raport statistic asupra fișierelor de intrare procesate.
-d Generați distribuția simțurilor în funcție de lungimea șirului de caractere pe fișierele de intrare
prelucrate.
-i Generați fișierul index de sens.
-o Comandă simțurile folosind cntlist.
-n Generați legături de nominalizare (morfologie derivată) în baza de date.
nume de fișier Fișierul de intrare al formularului descris în Intrare Fișiere.
Utilizați grind online folosind serviciile onworks.net