Este é o comando grind que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS
PROGRAMA:
NOME
grind - processar arquivos do lexicógrafo do WordNet
SINOPSE
cascalho [ -v ] [ -s ] [ -Larquivo de log ] [ -a ] [ -d ] [ -i ] [ -o ] [ -n ] nome do arquivo [
nome do arquivo...]
DESCRIÇÃO
moer() processa arquivos lexicógrafo do WordNet, produzindo arquivos de banco de dados adequados para uso
com o código de interface e pesquisa do WordNet e outros aplicativos. O sintático e
integridade estrutural dos arquivos de entrada é verificada. Avisos e erros são relatados via
stderr e um registro de tempo de execução é produzido em stdout. Um banco de dados é gerado apenas se houver
não há erros.
Entrada Arquivos
Os arquivos de entrada correspondem às categorias sintáticas implementadas no WordNet - substantivo, verbo,
adjetivo e advérbio. Cada arquivo lexicógrafo de entrada consiste em uma lista de conjuntos de sinônimos
(conjuntos de sincronização) para uma classe gramatical. Embora a sintaxe de sintaxe básica seja a mesma para todos os
as classes gramaticais, algumas partes gramaticais aplicam-se apenas a uma classe gramatical específica.
See entrada(5WN) para uma descrição do formato do arquivo de entrada.
Cada nome do arquivo especificado é da forma:
pathname/postar.sufixo
onde pathname é opcional e postar é também substantivo, verbo, adj or adv. sufixo pode ser usado
separar grupos de synsets em arquivos diferentes, por exemplo substantivo.animal e
substantivo.planta. Um ou mais arquivos de entrada, em qualquer combinação de categorias sintáticas, podem ser
Especificadas. Ver nomeslex(5WN) para obter uma lista dos arquivos lexicógrafos usados para construir o
banco de dados WordNet completo.
saída Arquivos
moer() produz os seguintes arquivos de saída:
┌──────────────┬─────────────────────────────────────── ────┐
│ Nome do arquivo │ Descrição │
├──────────────┼─────────────────────────────────────── ────┤
│índice.postar │ Arquivo de índice para cada categoria sintática │
│dados.postar │ Arquivo de dados para cada categoria sintática │
│índice.sense │ Índice de sentido │
└──────────────┴─────────────────────────────────────── ────┘
See wndb(5WN) para uma descrição dos formatos de arquivo de banco de dados.
Toda vez moer() é executado, todos os arquivos de banco de dados existentes são sobrescritos com o banco de dados
arquivos gerados a partir dos arquivos de entrada especificados. Se nenhum arquivo de entrada de um sintático
categoria são especificados, os arquivos de banco de dados correspondentes não são sobrescritos.
sentido Números
Os sentidos são geralmente ordenados do mais usado para o menos frequente, com o mais comum
sentido numerado 1. A frequência de uso é determinada pelo número de vezes que um sentido é marcado
nos vários textos de concordância semântica. Sentidos que não são semanticamente marcados seguem
os sentidos ordenados em uma ordem arbitrária. Observe que este pedido é apenas uma estimativa
com base no uso em um pequeno corpus.
O tagsense_cnt campo para cada entrada no índice.postar arquivos indica quantos dos
sentidos na lista foram marcados.
O lista cnt arquivo fornecido com o banco de dados lista o número de vezes que cada sentido é marcado
nas concordâncias semânticas. moer() usa os dados de lista cnt para ordenar os sentidos de
cada palavra. Quando o índice.postar arquivos são gerados, o synset_offsets são produzidos no sentido
ordem numérica, com o sentido 1 primeiro na lista. Sentidos com o mesmo número de semântica
tags são atribuídos a números de sentido únicos, mas consecutivos. The WordNet VISÃO GERAL pesquisar
exibe todos os sentidos da palavra especificada, em todas as categorias sintáticas e indica
quais dos sentidos são representados nos textos semanticamente marcados.
OPÇÕES
-v Verifique a integridade da entrada sem gerar banco de dados.
-s Suprime a geração de mensagens de aviso. Usualmente cascalho é executado com isso
opção até que todos os erros sintáticos e estruturais sejam corrigidos desde o
mensagens de aviso podem dificultar a localização de mensagens de erro.
-Larquivo de log Escreva todas as mensagens para arquivo de log em vez de stderr.
-a Gerar relatório estatístico sobre os arquivos de entrada processados.
-d Gerar distribuição de sentidos por relatório de comprimento de string em arquivos de entrada
processado.
-i Gerar arquivo de índice de detecção.
-o Sentidos de ordem usando lista cnt.
-n Gere links de nominalização (morfologia derivacional) no banco de dados.
nome do arquivo Arquivo de entrada do formulário descrito em Entrada Arquivos.
Use grind online usando serviços onworks.net