htload: en línea en la nube

Este es el comando htload que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


htload: lee en una versión de texto ASCII de la base de datos de documentos

SINOPSIS


carga [opciones]

DESCRIPCIÓN


Htload lee en una versión de texto ASCII de la base de datos de documentos en la misma forma que la
-t opción de htdig y htdump. Tenga en cuenta que esto sobrescribirá los datos en sus bases de datos,
por lo que debe usarse con mucho cuidado.

CAMPUS


-a Utilice archivos de trabajo alternativos. Le dice a htload que se anexe .trabajo a archivos de base de datos, lo que permite
para operar en un segundo conjunto de bases de datos.

-c archivo de configuración
Utilice el especificado archivo de configuración en lugar del predeterminado.

-i Inicial. No utilice bases de datos antiguas. Esto se logra borrando primero el
bases de datos.

-v Modo detallado. Esto no tiene mucho efecto.

Archive Formatos


Documento Base de datos
Cada línea del archivo comienza con la identificación del documento seguida de una lista de nombre de campo :
propuesta de separados por pestañas. Los campos siempre aparecen en el orden que se indica a continuación:

u Enlance

t Título

a Estado (0 = normal, 1 = no encontrado, 2 = no indexado, 3 = obsoleto)

m Hora de la última modificación según lo informado por el servidor

s Tamaño en bytes

H Extracto

h Meta descripción

l Hora de la última recuperación

L Recuento de enlaces en el documento (enlaces salientes)

b Recuento de enlaces al documento (enlaces entrantes o backlinks)

c HopCount de este documento

g Firma del documento utilizado para la detección de duplicados

e Dirección de correo electrónico que se utilizará para un mensaje de notificación de htnotify

n Fecha para enviar un mensaje de correo electrónico de notificación

S Asunto de un mensaje de correo electrónico de notificación

d El texto de los enlaces que apuntan a este documento. (por ejemplo, <a
href = "/ docURL"> descripción)

A Anclas en el documento (es decir,

Palabra Base de datos
Si bien htdump y htload no tratan directamente con la base de datos de palabras, vale la pena
mencionarlo aquí porque debe tratar con él al copiar el ASCII
bases de datos de un sistema a otro. La base de datos de palabras inicial producida por htdig
ya está en formato ASCII, y htmerge produce una versión binaria, para
uso por htsearch. Entonces, cuando copia la versión ASCII de la base de datos de documentos
producido por htdump, también debe copiar la lista de palabras, luego ejecutar htload para
crear la base de datos de documentos binarios en el sistema de destino, seguido de ejecutar htmerge
para hacer el índice de palabras.

Cada línea del archivo de lista de palabras comienza con la palabra
seguido de una lista de nombre de campo : propuesta de separados por pestañas. Los campos siempre aparecen
en el orden que se indica a continuación, siendo los dos últimos opcionales:

i ID del documento

l Ubicación de la palabra en el documento (1 a 1000)

w Peso de la palabra basado en factores de puntuación

c Recuento de apariciones de palabras en el documento, si hay más de 1

a Número de ancla si la palabra ocurrió después de un ancla con nombre

Use htload en línea usando los servicios de onworks.net



Últimos programas en línea de Linux y Windows