Il s'agit de la commande qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS.
PROGRAMME:
Nom
grind - traiter les fichiers du lexicographe WordNet
SYNOPSIS
gravier [ -v ] [ -s ] [ -Lfichier journal ] [ -a ] [ -d ] [ -i ] [ -o ] [ -n ] nom de fichier [
nom de fichier...]
DESCRIPTION
moudre() traite les fichiers lexicographe WordNet, produisant des fichiers de base de données adaptés à l'utilisation
avec le code de recherche et d'interface WordNet et d'autres applications. La syntaxe et
l'intégrité structurelle des fichiers d'entrée est vérifiée. Les avertissements et les erreurs sont signalés via
stderr et un journal d'exécution est produit sur Stdout. Une base de données n'est générée que s'il y a
il n'y a pas d'erreurs.
Entrée Documents officiels
Les fichiers d'entrée correspondent aux catégories syntaxiques implémentées dans WordNet - nom, verbe,
adjectif et adverbe. Chaque fichier lexicographe d'entrée se compose d'une liste d'ensembles de synonymes
(synsets) pour une partie du discours. Bien que la syntaxe de base du synset soit la même pour tous
Dans les parties du discours, certaines parties de la syntaxe ne s'appliquent qu'à une partie particulière du discours.
See wnentrée(5WN) pour une description du format du fichier d’entrée.
Chaque nom de fichier spécifié est de la forme :
chemin d'accès/poster.suffixe
où chemin d'accès est facultatif et poster est soit nom, verbe, adj or adv. suffixe peut être utilisé
pour séparer des groupes de synsets en différents fichiers, par exemple nom.animal et
nom.plante. Un ou plusieurs fichiers d'entrée, dans n'importe quelle combinaison de catégories syntaxiques, peuvent être
spécifié. Voir noms lex(5WN) pour une liste des fichiers lexicographe utilisés pour construire le
base de données WordNet complète.
Sortie Documents officiels
moudre() produit les fichiers de sortie suivants :
┌────────────┬────────────────────────── ────────── ────┐
│ Nom de fichier │ Description │
├────────────┼────────────────────────── ────────── ────┤
│indice.poster │ Fichier d'index pour chaque catégorie syntaxique │
│revendre.poster │ Fichier de données pour chaque catégorie syntaxique │
│index.sense │ Indice sensoriel │
└────────────┴────────────────────────── ────────── ────┘
See wndb(5WN) pour une description des formats de fichiers de base de données.
Chaque fois moudre() est exécuté, tous les fichiers de base de données existants sont écrasés par la base de données
fichiers générés à partir des fichiers d’entrée spécifiés. Si aucun fichier d'entrée d'un système syntaxique
catégorie sont spécifiées, les fichiers de base de données correspondants ne sont pas écrasés.
Sense Nombres
Les sens sont généralement classés du plus au moins fréquemment utilisé, le plus courant étant
sens numéroté 1. La fréquence d'utilisation est déterminée par le nombre de fois qu'un sens est tagué
dans les différents textes de concordance sémantique. Les sens qui ne sont pas sémantiquement étiquetés suivent
les sens ordonnés dans un ordre arbitraire. Notez que cette commande n'est qu'une estimation
basé sur une utilisation dans un petit corpus.
Le manuel de formation tagsense_cnt champ pour chaque entrée dans le indice.poster fichiers indique combien de fichiers
les sens de la liste ont été étiquetés.
Le manuel de formation liste de contrôle le fichier fourni avec la base de données répertorie le nombre de fois où chaque sens est étiqueté
dans les concordances sémantiques. moudre() utilise les données de liste de contrôle pour ordonner les sens de
chaque mot. Quand le indice.poster les fichiers sont générés, le synset_offsets sont émis dans le sens
ordre des nombres, avec le sens 1 en premier dans la liste. Sens avec le même nombre de sémantiques
les balises se voient attribuer des numéros de sens uniques mais consécutifs. Le WordNet APERÇU recherche
affiche tous les sens du mot spécifié, dans toutes les catégories syntaxiques, et indique
lesquels des sens sont représentés dans les textes sémantiquement étiquetés.
OPTIONS
-v Vérifiez l’intégrité de l’entrée sans générer de base de données.
-s Supprimer la génération de messages d'avertissement. Généralement gravier est exécuté avec ça
option jusqu'à ce que toutes les erreurs syntaxiques et structurelles soient corrigées depuis le
les messages d'avertissement peuvent rendre difficile la détection des messages d'erreur.
-Lfichier journal Écrivez tous les messages à fichier journal au lieu de stderr.
-a Générer un rapport statistique sur les fichiers d'entrée traités.
-d Générer un rapport sur la distribution des sens par longueur de chaîne sur les fichiers d'entrée
traité.
-i Générer un fichier d'index de sens.
-o Ordonner les sens en utilisant liste de contrôle.
-n Générez des liens de nominalisation (morphologie dérivée) dans la base de données.
nom de fichier Fichier d'entrée du formulaire décrit dans Entrée Des dossiers.
Utilisez Grind en ligne en utilisant les services onworks.net