Este es el comando omindex que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
omindex: indexa datos de sitios web estáticos a través del sistema de archivos
SINOPSIS
omíndice [OPCIONES] --db BASE DE DATOS [DIRBASE] De miembros
DESCRIPCIÓN
omindex: indexa datos de sitios web estáticos a través del sistema de archivos
DIRECTORIO es el directorio desde el que comenzar a indexar.
BASEDIR es el directorio correspondiente a la URL (predeterminado: DIRECTORIO).
OPCIONES
-d, - duplicados
establecer manejo de duplicados ('ignorar' o 'reemplazar')
-p, --no-eliminar
omitir la eliminación de documentos correspondientes a archivos eliminados
(- preservar-no duplicados es un alias obsoleto para --no-eliminar)
-e, --vacío-docs=ARG
cómo manejar documentos de los que no extraemos texto: ARG se puede indexar, advertir (emitir un
diagnóstico e índice), u omitir. (predeterminado: advertir)
-D, --db=BASE DE DATOS
ruta a la base de datos para usar
-U, --url=URL
URL base BASEDIR corresponde a (predeterminado: /)
-M, --tipo de Mimica=EXT:ESCRIBE
suponga que cualquier archivo con extensión EXT tiene TIPO de tipo de contenido MIME, en lugar de usar
libmagic (TYPE vacío elimina cualquier mapeo existente para EXT)
-F, --filtrar=TIPO: CMD
procesar archivos con MIME Content-Type TYPE usando el comando CMD, que debería producir
Texto UTF-8 en stdout, p. Ej. -Aplicación/ octet-stream: 'cadenas -N8'
-l, --límite de profundidad=LIMITE LAS
establecer límite de recursividad (0 = ilimitado)
-f, --seguir
seguir enlaces simbólicos
-i, - ignorar exclusiones
ignorar las metaetiquetas de robots y exclusiones similares
-S, --ortografía
datos de índice para la corrección ortográfica
-m, --tamaño máximo
tamaño máximo de archivo para indexar (en bytes o con un sufijo de 'K' / 'k', 'M' / 'm',
'G' / 'g') (predeterminado: ilimitado)
-E, --tamaño de la muestra=TAMAÑO
tamaño máximo para la muestra de texto del documento (admite los mismos formatos que
--tamaño máximo). (predeterminado: 512)
-T, --título-tamaño=TAMAÑO
tamaño máximo para el título del documento (admite los mismos formatos que --tamaño máximo).
(predeterminado: 128)
-v, --verboso
mostrar más información sobre lo que está sucediendo
--Sobrescribir
crear la base de datos de nuevo (el valor predeterminado es actualizar si la base de datos ya existe)
-s, --temador=IDIOMA
establecer el idioma de origen (predeterminado: inglés). Valores posibles: danés holandés
inglés finlandés francés alemán german2 húngaro italiano kraaij_pohlmann lovins
porter noruego portugués rumano ruso español sueco turco (pase 'ninguno'
para deshabilitar la derivación)
-h, --ayuda
muestra esta ayuda y salir
-V, --versión
salida de información de la versión y salir
Informe los errores en: http://xapian.org/bugs
Utilice omindex en línea utilizando los servicios de onworks.net
