Questo è il comando grind che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre numerose workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online di Windows o emulatore online di MAC OS
PROGRAMMA:
NOME
grind - elabora i file del lessicografo WordNet
SINOSSI
ghiaia [ -v ] [ -s ] [ -Lfile di log ] [ -a ] [ -d ] [ -i ] [ -o ] [ -n ] Nome del file [
Nome del file...]
DESCRIZIONE
macinare() elabora i file del lessicografo WordNet, producendo file di database adatti all'uso
con il codice di ricerca e interfaccia di WordNet e altre applicazioni. La sintassi e
L'integrità strutturale dei file di input viene verificata. Avvisi ed errori vengono segnalati tramite
stderr e viene prodotto un registro di runtime su stdoutUn database viene generato solo se esiste
non ci sono errori.
Ingresso File
I file di input corrispondono alle categorie sintattiche implementate in WordNet - sostantivo, verbo,
aggettivo e avverbioOgni file di input del lessicografo è costituito da un elenco di set di sinonimi
(synset) per una parte del discorso. Sebbene la sintassi di base del synset sia la stessa per tutti
le parti del discorso, alcune parti della sintassi si applicano solo a una particolare parte del discorso.
See wninput(5WN) per una descrizione del formato del file di input.
Ogni Nome del file specificato è della forma:
pathname/inviare.suffisso
where pathname è facoltativo e inviare è l'uno o l'altro sostantivo, verbo, adj or adv. suffisso può essere usato
per separare gruppi di synset in file diversi, ad esempio sostantivo.animale e
sostantivo.pianta. Uno o più file di input, in qualsiasi combinazione di categorie sintattiche, possono essere
specificato. Vedere nomi di lex(5WN) per un elenco dei file lessicografici utilizzati per costruire il
database completo di WordNet.
Uscita File
macinare() produce i seguenti file di output:
┌─────────────┬────────────────────────────────────────┐
│ Nome del file │ Descrizione │
├────────────┼───────────────────────────────────────┤
│indice.inviare │ File indice per ogni categoria sintattica │
│dati.inviare │ File di dati per ogni categoria sintattica │
│indice.senso │ Indice di senso │
└──────────────┴──────────────────────────────────────┘
See wndb(5WN) per una descrizione dei formati dei file del database.
Ogni volta macinare() viene eseguito, tutti i file di database esistenti vengono sovrascritti con il database
file generati dai file di input specificati. Se non ci sono file di input da un file sintattico
vengono specificate le categorie, i file del database corrispondenti non vengono sovrascritti.
Sensazioni numeri
I sensi sono generalmente ordinati dal più al meno frequentemente utilizzati, con il più comune
senso numerato 1La frequenza d'uso è determinata dal numero di volte in cui un senso viene taggato
nei vari testi di concordanza semantica. I sensi che non sono etichettati semanticamente seguono
i sensi ordinati in un ordine arbitrario. Si noti che questo ordinamento è solo una stima
basato sull'utilizzo in un piccolo corpus.
. tagsense_cnt campo per ogni voce nel indice.inviare file indica quanti dei
i sensi nell'elenco sono stati taggati.
. cntlist il file fornito con il database elenca il numero di volte in cui ogni senso è taggato
nelle concordanze semantiche. macinare() utilizza i dati da cntlist per ordinare i sensi di
ogni parola. Quando il Index.inviare vengono generati i file, il sinset_offsets sono output in senso
ordine numerico, con il senso 1 al primo posto nell'elenco. Sensi con lo stesso numero di semantiche
ai tag vengono assegnati numeri di senso univoci ma consecutivi. WordNet OVERVIEW Ricerca
visualizza tutti i sensi della parola specificata, in tutte le categorie sintattiche, e indica
quali sensi sono rappresentati nei testi etichettati semanticamente.
VERSIONI
-v Verifica l'integrità dell'input senza generare un database.
-s Sopprimere la generazione di messaggi di avviso. Di solito ghiaia viene eseguito con questo
opzione finché tutti gli errori sintattici e strutturali non saranno corretti dal momento che
i messaggi di avviso potrebbero rendere difficile individuare i messaggi di errore.
-Lfile di log Scrivi tutti i messaggi a file di log invece di stderr.
-a Genera un report statistico sui file di input elaborati.
-d Generare la distribuzione dei sensi in base alla lunghezza della stringa nei file di input
trasformati.
-i Genera file indice di senso.
-o Ordina i sensi usando cntlist.
-n Generare collegamenti di nominalizzazione (morfologia derivativa) nel database.
Nome del file File di input del modulo descritto in Ingresso File.
Utilizzare Grind online utilizzando i servizi onworks.net