Este é o comando htdump que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS
PROGRAMA:
NOME
htdump - escreve uma versão em texto ASCII da base de dados do documento
SINOPSE
htdump [opções]
DESCRIÇÃO
Htdump grava uma versão de texto ASCII do banco de dados de documentos da mesma forma que o
opção -t de htdig.
OPÇÕES
-a Use arquivos de trabalho alternativos. Diz ao htdump para anexar .trabalhos para arquivos de banco de dados, permitindo
para operar em um segundo conjunto de bancos de dados.
-c arquivo de configuração
Use o especificado arquivo de configuração em vez do padrão.
-v Modo detalhado. Isso não tem muito efeito.
Envie o Formatos
ISO banco de dados
Cada linha do arquivo começa com o id do documento seguido por uma lista de fieldname :
valor separados por tabulações. Os campos sempre aparecem na ordem listada abaixo:
u URL
t Título
a Estado (0 = normal, 1 = não encontrado, 2 = não indexado, 3 = obsoleto)
m Hora da última modificação conforme relatado pelo servidor
s Tamanho em bytes
H Excerto
h Meta description
l Hora da última recuperação
L Contagem de links no documento (links de saída)
b Contagem de links para o documento (links de entrada ou backlinks)
c HopCount deste documento
g Assinatura do documento usado para detecção de duplicatas
e Endereço de e-mail a ser usado para uma mensagem de notificação do htnotify
n Data para enviar uma mensagem de e-mail de notificação
S Assunto para uma mensagem de e-mail de notificação
d O texto dos links apontando para este documento. (por exemplo, <a
href = "/ docURL"> descrição)
A Âncoras no documento (ou seja
Word banco de dados
Embora htdump e htload não lidem com a palavra banco de dados diretamente, vale a pena
mencioná-lo aqui porque você precisa lidar com isso ao copiar o ASCII
bancos de dados de um sistema para outro. O banco de dados de palavras inicial produzido por htdig
já está no formato ASCII, e uma versão binária dele é produzida por htmerge, para
usar por htsearch. Então, quando você copia a versão ASCII do banco de dados de documentos
produzido por htdump, você precisa copiar a lista de palavras também e, em seguida, executar htload para
faça o banco de dados de documentos binários no sistema de destino, seguido pela execução de htmerge
para fazer o índice da palavra.
Cada linha no arquivo de lista de palavras começa com a palavra
seguido por uma lista de fieldname : valor separados por tabulações. Os campos sempre aparecem
na ordem listada abaixo, com os dois últimos sendo opcionais:
i ID do Documento
l Localização da palavra no documento (1 a 1000)
w Peso da palavra com base em fatores de pontuação
c Contagem de aparições de palavras no documento, se mais de 1
a Número da âncora se a palavra ocorreu após uma âncora nomeada
Use htdump online usando serviços onworks.net