Questo è il comando grind che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
grind - elabora i file del lessicografo di WordNet
SINOSSI
ghiaia [ -v ] [ -s ] [ -Lfile di log ] [ -a ] [ -d ] [ -i ] [ -o ] [ -n ] Nome del file [
Nome del file...]
DESCRIZIONE
macinare() elabora i file del lessicografo di WordNet, producendo file di database adatti all'uso
con la ricerca WordNet e il codice di interfaccia e altre applicazioni. La sintattica e
viene verificata l'integrità strutturale dei file di input. Avvisi ed errori vengono segnalati tramite
stderr e viene prodotto un registro di runtime su stdout. Un database viene generato solo se esiste
non sono errori.
Ingresso File
I file di input corrispondono alle categorie sintattiche implementate in WordNet - sostantivo, verbo,
aggettivo ed avverbio. Ogni file del lessicografo di input è costituito da un elenco di insiemi di sinonimi
(synset) per una parte del discorso. Sebbene la sintassi di base del synset sia la stessa per tutti
le parti del discorso, alcune parti della sintassi si applicano solo a una particolare parte del discorso.
See ingresso(5WN) per una descrizione del formato del file di input.
Ogni Nome del file specificato è della forma:
pathname/inviare.suffisso
where pathname è facoltativo e inviare è l'uno o l'altro sostantivo, verbo, adj or adv. suffisso può essere usato
per separare gruppi di synset in file diversi, ad esempio sostantivo.animali ed
sostantivo.pianta. Uno o più file di input, in qualsiasi combinazione di categorie sintattiche, possono essere
specificato. Vedere nomi lex(5WN) per un elenco dei file del lessicografo usati per costruire il
database completo di WordNet.
Uscita File
macinare() produce i seguenti file di output:
? ?
│ Nome del file │ Descrizione │
? ?
│indice.inviare │ File indice per ogni categoria sintattica │
│dati.inviare │ File di dati per ogni categoria sintattica │
│indice.senso │ Indice dei sensi │
? ?
See wndb(5WN) per una descrizione dei formati di file del database.
Ogni volta macinare() viene eseguito, tutti i file di database esistenti vengono sovrascritti con il database
file generati dai file di input specificati. Se nessun file di input da una sintattica
categoria sono specificati, i file di database corrispondenti non vengono sovrascritti.
Sensazioni numeri
I sensi sono generalmente ordinati dal più usato al meno frequente, con il più comune
senso numerato 1. La frequenza di utilizzo è determinata dal numero di volte in cui viene taggato un senso
nei vari testi di concordanza semantica. I sensi che non sono etichettati semanticamente seguono
i sensi ordinati in un ordine arbitrario. Nota che questo ordine è solo una stima
basato sull'utilizzo in un piccolo corpus.
Il tagense_cnt campo per ogni voce del indice.inviare file indica quanti dei
i sensi nell'elenco sono stati taggati.
Il cntlist il file fornito con il database elenca il numero di volte in cui viene taggato ogni senso
nelle concordanze semantiche. macinare() utilizza i dati di cntlist per ordinare i sensi di
ogni parola. Quando il Index.inviare i file vengono generati, il sinset_offsetvengono emessi in senso
ordine numerico, con il senso 1 per primo nell'elenco. Sensi con lo stesso numero di semantica
ai tag vengono assegnati numeri di rilevamento univoci ma consecutivi. La rete delle parole OVERVIEW Ricerca
mostra tutti i sensi della parola specificata, in tutte le categorie sintattiche, e indica
quali dei sensi sono rappresentati nei testi etichettati semanticamente.
VERSIONI
-v Verifica l'integrità dell'input senza generare database.
-s Sopprime la generazione di messaggi di avviso. Generalmente ghiaia è eseguito con questo
opzione fino a quando tutti gli errori sintattici e strutturali non vengono corretti dal
i messaggi di avviso possono rendere difficile individuare i messaggi di errore.
-Lfile di log Scrivi tutti i messaggi a file di log invece di stderr.
-a Genera report statistici sui file di input elaborati.
-d Genera la distribuzione dei sensi per rapporto sulla lunghezza delle stringhe sui file di input
trasformati.
-i Genera file indice di rilevamento.
-o Ordina i sensi usando cntlist.
-n Generare collegamenti di nominalizzazione (morfologia derivata) nel database.
Nome del file File di input del modulo descritto in Ingresso File.
Usa grind online utilizzando i servizi onworks.net