InglésFrancésEspañol

Ad


icono de página de OnWorks

httrack: en línea en la nube

Ejecute httrack en el proveedor de alojamiento gratuito de OnWorks sobre Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando httrack que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


httrack - navegador sin conexión: copia sitios web a un directorio local

SINOPSIS


httrack [ url ] ... [ -filtrar ] ... [ + filtro ] ... [ -Oh, --sendero ] [ -w, --espejo ] [ -W,
--mago de espejos ] [ -gramo, --obtener archivos ] [ -I, --Seguir ] [ -Y, --Enlaces Espejo ] [ -PAG,
--apoderado ] [ -%F, --httpproxy-ftp [= N] ] [ -%B, --unir ] [ -rn, --depth [= N] ] [ -% eN,
--ext-depth [= N] ] [ -Minnesota, --max-files [= N] ] [ -MINNESOTA, --max-size [= N] ] [ -ES, --max-time [= N] ]
[ -UN, - tasa máxima [= N] ] [ -% cN, --conexión por segundo [= N] ] [ -GN, --max-pause [= N] ] [
-cN, --enchufes [= N] ] [ -TENNESSE, --tiempo de espera [= N] ] [ -RN, --reintentos [= N] ] [ -JN, --min-rate [= N] ]
[ -HN, --host-control [= N] ] [ -%PAG, --extended-parsing [= N] ] [ -norte, --cerca ] [ -t, --prueba ]
[ -% L, --lista ] [ -%S, --lista de URL ] [ -NN, --estructura [= N] ] [ -%D,
--cheched-delay-type-check ] [ -%METRO, --mimo-html ] [ -LN, --nombres-largos [= N] ] [ -KN,
--keep-links [= N] ] [ -X, --reemplazar-externo ] [ -%X, --deshabilitar-contraseñas ] [ -% q,
--include-cadena-de-consulta ] [ -Oh, --generar-errores ] [ -X, --purge-old [= N] ] [ -%pag,
--preservar ] [ -% T, --utf8-conversión ] [ -bN, --cookies [= N] ] [ -tu, --check-type [= N] ] [
-j, --parse-java [= N] ] [ -sn, --robots [= N] ] [ -% h, --http-10 ] [ -% k, --mantener viva ] [
-%B, --tolerante ] [ -%s, --actualizaciónhack ] [ -% u, --urlhack ] [ -%A, --asumir ] [ -@en,
--protocolo [= N] ] [ -% w, --deshabilitar-módulo ] [ -F, --agente de usuario ] [ -% R, --referente ] [ -%MI,
--desde ] [ -%F, --pie de página ] [ -% l, --idioma ] [ -%a, --aceptar ] [ -%X, --cabeceras ] [ -VS,
--caché [= N] ] [ -k, --almacenar-todo-en-caché ] [ -%norte, --no-recuperar ] [ -% v, --monitor ] [
-P, --no-registrar ] [ -q, --tranquilo ] [ -z, --extra-registro ] [ -Z, --registro de depuración ] [ -v, --verboso
] [ -F, --archivo-registro ] [ -f2, - registro único ] [ -YO, --índice ] [ -%I, --build-top-indice ] [
-%YO, --índice de búsqueda ] [ -pn, --prioridad [= N] ] [ -S, --permanecer-en-el-mismo-dir ] [ -RE,
--can-bajar ] [ -Tú, --puede-subir ] [ -B, --puede subir y bajar ] [ -a
- permanecer en la misma dirección ] [ -D, --permanecer en el mismo dominio ] [ -yo, --permanece-en-el-mismo-tld ] [ -mi,
- ir a todas partes ] [ -% H, --debug-cabeceras ] [ -% !, --desactivar-límites-de-seguridad ] [ -V,
--userdef-cmd ] [ -% W, --llamar de vuelta ] [ -K, --keep-links [= N] ] [

DESCRIPCIÓN


httrack le permite descargar un sitio World Wide Web de Internet a un local
directorio, construyendo recursivamente todos los directorios, obteniendo HTML, imágenes y otros archivos
desde el servidor a su computadora. HTTrack organiza el enlace relativo del sitio original-
estructura. Simplemente abra una página del sitio web "reflejado" en su navegador y podrá
navegue por el sitio de un enlace a otro, como si lo estuviera viendo en línea. HTTrack también puede
actualice un sitio duplicado existente y reanude las descargas interrumpidas.

EJEMPLOS


httrack www.someweb.com/bob/
sitio espejo www.someweb.com/bob/ y solo este sitio

httrack www.someweb.com/bob/ www.otrotest.com/mike/ + *. com / *. jpg -mime: aplicación / *
reflejar los dos sitios juntos (con enlaces compartidos) y aceptar cualquier archivo .jpg en
sitios .com

httrack www.someweb.com/bob/bobby.html +* -r6
significa obtener todos los archivos a partir de bobby.html, con 6 enlaces de profundidad y posibilidad de
yendo a todas partes en la web

httrack www.someweb.com/bob/bobby.html --araña -P proxy.mihost.com:8080
ejecuta la araña en www.someweb.com/bob/bobby.html usando un proxy

httrack --actualizar
actualiza un espejo en la carpeta actual

httrack
te llevará al modo interactivo

httrack --Seguir
continúa un espejo en la carpeta actual

CAMPUS


General opciones:
-O ruta para espejo / archivos de registro + caché (-O ruta espejo [, caché de ruta y archivos de registro]) (--ruta
)

la columna Acción opciones:
-w * sitios web espejo (--mirror)

-W sitios web espejo, semiautomático (hace preguntas) (--mirror-wizard)

-g solo obtiene archivos (guardados en el directorio actual) (--get-files)

-continúo un espejo interrumpido usando el caché (--continuar)

-Y reflejar TODOS los enlaces ubicados en las páginas del primer nivel (enlaces espejo) (--mirrorlinks)

apoderado opciones:
-P uso de proxy (-P proxy: puerto o -P usuario: pass @ proxy: puerto) (--proxy )

-% f * usa proxy para ftp (f0 no usa) (--httpproxy-ftp [= N])

-% b usa este nombre de host local para realizar / enviar solicitudes (-% b nombre de host) (--bind )

Límites opciones:
-rN establece la profundidad del espejo en N (* r9999) (--depth [= N])

-% eN establece la profundidad de los enlaces externos en N (*% e0) (--ext-depth [= N])

-mN longitud máxima de archivo para un archivo que no es HTML (--max-files [= N])

-mN, N2 longitud máxima de archivo para no html (N) y html (N2)

-MN tamaño total máximo que se puede cargar / escanear (--max-size [= N])

-EN tiempo máximo de espejo en segundos (60 = 1 minuto, 3600 = 1 hora) (--max-time [= N])

-AN tasa de transferencia máxima en bytes / segundos (1000 = 1 KB / s máx.) (--Max-rate [= N])

-% cN número máximo de conexiones / segundos (*% c10) (--conexión por segundo [= N])

-GN pausa la transferencia si se alcanzan N bytes y espera hasta que se elimine el archivo de bloqueo
(--máx-pausa [= N])

Flujo Control:
-cN número de conexiones múltiples (* c8) (--sockets [= N])

-TN timeout, número de segundos después de que se apaga un enlace que no responde (--timeout [= N])

-RN número de reintentos, en caso de tiempo de espera o errores no fatales (* R1) (--retries [= N])

-Control de atascos de tráfico JN, tasa de transferencia mínima (bytes / segundos) tolerada para un enlace
(--min-rate [= N])

-HN se abandona el host si: 0 = nunca, 1 = tiempo de espera, 2 = lento, 3 = tiempo de espera o lento
(--host-control [= N])

Enlaces opciones:
-% P * análisis extendido, intenta analizar todos los enlaces, incluso en etiquetas desconocidas o Javascript
(% P0 no usar) (- análisis-extendido [= N])

-n obtener archivos que no sean html cerca de un archivo html (por ejemplo, una imagen ubicada en el exterior) (--cerca)

-t prueba todas las URL (incluso las prohibidas) (--prueba)

-% L agregue todas las URL ubicadas en este archivo de texto (una URL por línea) (--list )

-%S agregue todas las reglas de escaneo ubicadas en este archivo de texto (una regla de escaneo por línea)
(--urllist )

Construcción opciones:
-NN tipo de estructura (0 * estructura original, 1+: ver más abajo) (--estructura [= N])

-o estructura definida por el usuario (-N "% h% p /% n% q.% t")

-% N verificación de tipo demorada, no realice ninguna prueba de enlace, pero espere a que comience la descarga de archivos
en su lugar (experimental) (% N0 no usar,% N1 usar para extensiones desconocidas, *% N2 siempre
utilizar)

-% D control de tipo retrasado en caché, no espere el tipo remoto durante las actualizaciones, para acelerar
ellos (% D0 espera, *% D1 no espera) (--cached-delayed-type-check)

-% M genera un archivo completo encapsulado en RFC MIME (.mht) (--mime-html)

-LN nombres largos (L1 * nombres largos / conversión L0 8-3 / compatible con L2 ISO9660)
(--nombres-largos [= N])

-KN mantiene los enlaces originales (p. Ej. http://www.adr/link) (K0 * enlace relativo, K absoluto
enlaces, enlaces originales K4, enlaces URI absolutos K3, enlace proxy transparente K5)
(--keep-links [= N])

-x reemplaza los enlaces html externos por páginas de error (--replace-external)

-% x no incluye ninguna contraseña para sitios web externos protegidos con contraseña (% x0 incluye)
(--disable-contraseñas)

-% q * incluye una cadena de consulta para archivos locales (inútil, solo con fines informativos) (% q0
no incluir) (--include-query-string)

-o * generar archivo html de salida en caso de error (404 ..) (o0 no generar)
(--generar-errores)

-X * purgar archivos antiguos después de la actualización (X0 mantener la eliminación) (--purge-old [= N])

-% p conserva los archivos html como están (idéntico a -K4 -% F "") (--preserve)

-% T conversión de enlaces a UTF-8 (--utf8-conversion)

Spiders opciones:
-bN aceptar cookies en cookies.txt (0 = no aceptar, * 1 = aceptar) (--cookies [= N])

-u verifica el tipo de documento si es desconocido (cgi, asp ..) (u0 no verifica, * u1 verifica pero /, u2
comprobar siempre) (--check-type [= N])

-j * analizar clases Java (j0 no analizar, máscara de bits: | 1 analizar predeterminado, | 2 no analizar
.class | 4 no parse .js | 8 no seas agresivo) (--parse-java [= N])

-sN sigue las etiquetas robots.txt y meta robots (0 = nunca, 1 = a veces, * 2 = siempre, 3 = siempre
(incluso reglas estrictas)) (--robots [= N])

-% h fuerza solicitudes HTTP / 1.0 (reduce las funciones de actualización, solo para servidores o proxies antiguos)
(--http-10)

-% k usa Keep-Alive si es posible, reduciendo en gran medida la latencia para archivos pequeños y pruebas
solicitudes (% k0 no usar) (--keep-alive)

- Solicitudes tolerantes% B (acepte respuestas falsas en algunos servidores, ¡pero no estándar!)
(--tolerante)

-% s trucos de actualización: varios trucos para limitar las retransferencias al actualizar (tamaño idéntico,
respuesta falsa ..) (--updatehack)

-% u URL hacks: varios trucos para limitar las URL duplicadas (strip //, www.foo.com == foo.com ..)
(--urlhack)

-% A supone que un tipo (cgi, asp ..) siempre está vinculado con un tipo mime (-% A
php3, cgi = texto / html; dat, bin = aplicación / x-zip) (--asume )

-también se puede usar para forzar un tipo de archivo específico: --assume foo.cgi = text / html

- @ iN protocolo de Internet (0 = ambos ipv6 + ipv4, 4 = solo ipv4, 6 = solo ipv6) (--protocol [= N])

-% w deshabilita un módulo mime externo específico (-% w htsswf -% w htsjava) (--disable-module
)

Navegador # de IDENTIDAD:
-F campo de agente de usuario enviado en encabezados HTTP (-F "nombre de agente de usuario") (--user-agent )

-% R campo de referencia predeterminado enviado en encabezados HTTP (--referer )

-% E de la dirección de correo electrónico enviada en encabezados HTTP (--desde )

- Cadena de pie de página% F en código HTML (-% F "Reflejado [del host% s [archivo% s [en% s]]]"
(--pie de página )

-% l idioma preferido (-% l "fr, en, jp, *" (--idioma )

-% a formatos aceptados (-% a "texto / html, imagen / png; q = 0.9, * / *; q = 0.1" (--accept )

-% X línea de encabezado HTTP adicional (-% X "X-Magic: 42" (- encabezados )

Iniciar sesión, índice, cache
-C crear / usar un caché para actualizaciones y reintentos (C0 sin caché, el caché C1 es prioritario, * C2
actualización de prueba antes) (--caché [= N])

-k almacena todos los archivos en la caché (no es útil si los archivos están en el disco) (--store-all-in-cache)

-% n no vuelve a descargar archivos borrados localmente (--do-not-recatch)

-% v muestra en la pantalla los nombres de los archivos descargados (en tiempo real) - *% v1 versión corta -% v2
animación completa (--display)

-Q sin registro - modo silencioso (--do-not-log)

-q sin preguntas - modo silencioso (- silencioso)

-z log - información adicional (--extra-log)

-Z log - depuración (--debug-log)

-v pantalla de inicio de sesión (--verbose)

-f * iniciar sesión en archivos (--file-log)

-f2 un solo archivo de registro (--single-log)

-Yo * hago un índice (I0 no lo hago) (--index)

-% hago un índice superior para una carpeta de proyecto (*% i0 no lo hago) (--build-top-index)

-% Hago un índice de búsqueda para este espejo (*% I0 no lo hago) (--search-index)

Experto opciones:
-pN modo de prioridad: (* p3) (--priority [= N])

-p0 solo escanee, no guarde nada (para verificar enlaces)

-p1 guarda solo archivos html

-p2 guarda solo archivos no html

- * p3 guardar todos los archivos

-p7 obtener archivos html antes, luego tratar otros archivos

-S permanecer en el mismo directorio (--stay-on-same-dir)

-D * solo puede bajar a subdirecciones (--can-go-down)

-U solo puede ir a directorios superiores (--can-go-up)

-B puede subir y bajar en la estructura del directorio (--can-go-up-and-down)

-a * permanecer en la misma dirección (--stay-on-same-address)

-d permanecer en el mismo dominio principal (--stay-on-same-domain)

-Me quedo en el mismo TLD (por ejemplo: .com) (--stay-on-same-tld)

-Voy a todas partes en la web (--go-a todas partes)

-% H depura los encabezados HTTP en el archivo de registro (--debug-headers)

Gurú opciones: (del NO utilizan el if posible)
- # X * use un motor optimizado (comprobaciones de límites de memoria limitada) (--fast-engine)

- Prueba de filtro # 0 (- # 0 * .gif www.bar.com/foo.gif) (--debug-testfilters )

- Prueba de simplificación n. ° 1 (- n. ° 1 ./foo/bar/../foobar)

- Prueba de tipo n. ° 2 (- n. ° 2 /foo/bar.php)

- Lista de caché # C (- # C * .com / spider * .gif (--debug-cache )

- Reparación de caché # R (caché dañada) (--repair-cache)

- # d analizador de depuración (--debug-parsing)

- # E extraer metadatos de caché new.zip en meta.zip

- # f siempre vaciar los archivos de registro (--advanced-flushlogs)

- # FN número máximo de filtros (--advanced-maxfilters [= N])

- # h información de la versión (--versión)

- # K scan stdin (depuración) (--debug-scanstdin)

- # L número máximo de enlaces (- # L1000000) (--advanced-maxlinks)

- # p muestra información de progreso fea (--advanced-progressinfo)

- URL de captura # P (--catch-url)

- # R antiguas rutinas FTP (depuración) (--repair-cache)

- # T generar operaciones de transferencia. registrar cada minutos (--debug-xfrstats)

- # tiempo de espera (--advanced-wait)

- # Z genera estadísticas de tasa de transferencia cada minuto (--debug-ratestats)

peligroso opciones: (del NO utilizan el a menos que Usted exactamente sabes qué qué Usted en haciendo)
-%! eludir los límites de seguridad incorporados destinados a evitar abusos de ancho de banda (ancho de banda,
conexiones simultáneas) (--disable-security-limits)

-IMPORTANTE
NOTA: OPCIÓN PELIGROSA, SOLO APTA PARA EXPERTOS

-ÚSALO CON EXTREMO CUIDADO

Línea de comando soluciones y opciones:
-V ejecutar el comando del sistema después de cada archivo ($ 0 es el nombre del archivo: -V "rm \ $ 0")
(--userdef-cmd )

-% W usa una función de biblioteca externa como contenedor (-% W myfoo.so [, myparameters])
(--llamar de vuelta )

Detalles: Optión N
-N0 Estructura del sitio (predeterminado)

-N1 HTML en web /, imágenes / otros archivos en web / imágenes /

-N2 HTML en web / HTML, imágenes / otros en web / imágenes

-N3 HTML en web /, imágenes / otro en web /

-N4 HTML en web /, images / other en web / xxx, donde xxx es la extensión del archivo (todos gif
se colocará en web / gif, por ejemplo)

-N5 Imágenes / otras en web / xxx y HTML en web / HTML

-N99 Todos los archivos en web /, con nombres aleatorios (¡gadget!)

-N100 Estructura del sitio, sin www.domain.xxx/

-N101 Idéntico a N1 excepto que "web" se reemplaza por el nombre del sitio

-N102 Idéntico a N2 excepto que "web" se reemplaza por el nombre del sitio

-N103 Idéntico a N3 excepto que "web" se reemplaza por el nombre del sitio

-N104 Idéntico a N4 excepto que "web" se reemplaza por el nombre del sitio

-N105 Idéntico a N5 excepto que "web" se reemplaza por el nombre del sitio

-N199 Idéntico a N99 excepto que "web" se reemplaza por el nombre del sitio

-N1001 Idéntico al N1 excepto que no hay un directorio "web"

-N1002 Idéntico al N2 excepto que no hay un directorio "web"

-N1003 Idéntico a N3 excepto que no hay un directorio "web" (opción establecida para la opción g)

-N1004 Idéntico al N4 excepto que no hay un directorio "web"

-N1005 Idéntico al N5 excepto que no hay un directorio "web"

-N1099 Idéntico al N99 excepto que no hay un directorio "web"

Detalles: Usuario definido opción N
% n Nombre del archivo sin tipo de archivo (ej .: imagen)
% N Nombre del archivo, incluido el tipo de archivo (p. Ej., Image.gif)
% t Tipo de archivo (ej .: gif)
% p Ruta [sin finalización /] (p. ej., / algunas imágenes)
% h Nombre de host (p. ej .: www.someweb.com)
% M URL MD5 (128 bits, 32 bytes ascii)
% Q cadena de consulta MD5 (128 bits, 32 bytes ascii)
% k cadena de consulta completa
% r nombre de protocolo (por ejemplo: http)
% q cadena de consulta pequeña MD5 (16 bits, 4 bytes ascii)
%¿s? Versión de nombre corto (ej .:% sN)
% [param] variable param en la cadena de consulta
% [param: before: after: empty: notfound] extracción de variable avanzada

Detalles: Usuario definido opción N y avanzado variable Extracción
% [param: antes: después: vacío: no encontrado]

-param: nombre del parámetro

-antes de
: cadena para anteponer si se encontró el parámetro

-after: cadena para agregar si se encontró el parámetro

-extraviado
: reemplazo de cadena si no se pudo encontrar el parámetro

-empty: reemplazo de cadena si el parámetro estaba vacío

-todos los campos, excepto el primero (el nombre del parámetro), pueden estar vacíos

Detalles: Optión K
-K0 foo.cgi? Q = 45 -> foo4B54.html? Q = 45 (URI relativo, predeterminado)

-K -> http://www.foobar.com/folder/foo.cgi? q = 45 (URL absoluta) (--keep-links [= N])

-K3 -> /folder/foo.cgi?q=45 (URI absoluto)

-K4 -> foo.cgi? Q = 45 (URL original)

-K5 -> http://www.foobar.com/folder/foo4B54.html? q = 45 (URL de proxy transparente)

Atajos:
--espejo
* hacer un espejo del sitio (s) (predeterminado)

--obtener
obtener los archivos indicados, no buscar otras URL (-qg)

--lista
agregar todas las URL ubicadas en este archivo de texto (-% L)

--Enlaces Espejo
Duplicar todos los enlaces en páginas de primer nivel (-Y)

--vínculos de prueba
enlaces de prueba en las páginas (-r1p0C0I0t)

--araña
sitio (s) de araña, para probar enlaces: informes de errores y advertencias (-p0C0I0t)

--sitio de prueba
idéntico a --spider

--esqueleto
crea un espejo, pero solo obtiene archivos html (-p1)

--actualizar
actualizar un espejo, sin confirmación (-iC2)

--Seguir
continuar un espejo, sin confirmación (-iC1)

--catchurl
crear un proxy temporal para capturar una URL o una URL de publicación de formulario

--limpio
borrar caché y archivos de registro

--http10
forzar solicitudes http / 1.0 (-% h)

Detalles: Optión % W: Externo devoluciones de llamada prototipos
ver htsdefines.h

Use httrack en línea usando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

Comandos de Linux

Ad