InglésFrancésEspañol

Ejecutar servidores | Ubuntu > | Fedora > |


icono de página de OnWorks

webcheck - Online en la nube

Ejecute webcheck en el proveedor de alojamiento gratuito de OnWorks a través de Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando webcheck que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


webcheck - verificador de enlaces de sitios web

SINOPSIS


webcheck [OPCIÓN] ... Enlance

DESCRIPCIÓN


webcheck comprobará el documento en la URL especificada en busca de enlaces a otros documentos, siga
estos enlaces de forma recursiva y generan un informe HTML.

-I, --internal =PATRÓN
Marque las URL que coincidan con PATRÓN (expresión regular de tipo perl) como enlace interno.
Puede ser usado múltiples veces. Tenga en cuenta que el PATRÓN se compara con la URL completa.
Las URL que coincidan con este PATRÓN se considerarán internas, incluso si coinciden con uno de
los PATRONES externos.

-X, --external =PATRÓN
Marque las URL que coincidan con PATRÓN (expresión regular de tipo perl) como un enlace externo.
Puede ser usado múltiples veces. Tenga en cuenta que el PATRÓN se compara con la URL completa.

-y, --yank =PATRÓN
No verifique las URL que coincidan con PATRÓN (expresión regular de tipo perl). Como la -x
flag, aunque esta opción hará que webcheck no verifique el enlace que coincide con regex
mientras que -x comprobará el enlace pero no sus hijos. Puede ser usado múltiples veces.
Tenga en cuenta que el PATRÓN se compara con la URL completa.

-B, - solo base
Considere que cualquier URL que no comience con la URL base sea externa. Por ejemplo, si
tu corres
webcheck -b http://www.example.com/foo
luego http://www.example.com/foo/bar se considerará interno mientras que
http://www.example.com/ se considerará externo. De forma predeterminada, todas las páginas de
el sitio se considerará interno.

-a - evitar-externo
Evite los enlaces externos. Normalmente, si webcheck está examinando una página HTML y encuentra
un enlace que apunta a un documento externo, comprobará si ese
existe el documento. Esta bandera deshabilita esa acción.

- ignorar-robots
No recupere ni analice archivos robots.txt. De forma predeterminada, los archivos robots.txt son
recuperado y honrado. Si está seguro de que desea ignorar y anular la
decisión del webmaster se puede utilizar esta opción.
Para obtener más información sobre el manejo de robots.txt, consulte la sección NOTAS a continuación.

-q, --tranquilo, --silencio
No imprima el progreso mientras webcheck recorre un sitio.

-D, --depurar
Imprima información de depuración mientras rastrea el sitio. Esta opción es principalmente útil
para desarrolladores

-o, --salida =RECURSOS
Directorio de salida. Úselo para especificar el directorio donde webcheck volcará su
informes. El predeterminado es el directorio actual o el especificado por config.py. Si esto
El directorio no existe, se creará para usted (si es posible).

-C, --Seguir
Intente continuar desde una ejecución anterior. Al usar esta opción, webcheck buscará
un webcheck.dat en el directorio de salida. Este archivo se lee para restaurar el estado
de la ejecución anterior. Esto permite que webcheck continúe con una
correr. Cuando se usa esta opción, las opciones --internal, --external y --yank
ignorarse, así como cualquier argumento de URL. El --base-only y --avoid-external
las opciones deben ser las mismas que las de la ejecución anterior.
Tenga en cuenta que esta opción es experimental y su semántica puede cambiar con la llegada
lanzamientos (especialmente en relación con otras opciones). También tenga en cuenta que el almacenado
no se garantiza que los archivos sean compatibles entre versiones.

-F, --fuerza
Sobrescriba archivos sin preguntar. Esta opción es necesaria para ejecutar webcheck no
interactivamente.

-r, --redirectos =N
Redirigir profundidad. el número de redireccionamientos que debe seguir la verificación web al seguir un
Enlace. 0 implica seguir todas las redirecciones.

-tu, --userpass =Enlance
Especifique una URL con información de nombre de usuario y contraseña para usar en los
autenticación al visitar el sitio.
p.ej http://test:secreto@ejemplo.com/
Esta opción se puede especificar varias veces.

-w, --wait =SEGUNDOS
Esperar SEGUNDOS entre recuperaciones de documentos. Por lo general, webcheck procesará una URL y
pasar inmediatamente al siguiente. Sin embargo, en algunos sistemas cargados puede ser deseable
para que webcheck haga una pausa entre solicitudes. Esta opción se puede establecer en cualquier
numero negativo.

-v, --versión
Muestra la versión del programa.

-h, --ayuda
Muestra un breve resumen de opciones.

Enlance CLASES


Las URL se dividen en dos clases:

Interno Se recuperan las URL y se comprueba la sintaxis del elemento recuperado. También el
El elemento recuperado se busca en busca de enlaces a otros elementos (de cualquier clase) y estos enlaces son
seguirían.

Externo Las URL solo se recuperan para probar si son válidas y para recopilar algunos
información de ellos (título, tamaño, tipo de contenido, etc.). Los elementos recuperados no son
inspeccionado en busca de enlaces a otros elementos.

Aparte de su clase, las URL también se pueden considerar tirado (como se especifica con el --yank
o - evitar opciones externas). Las URL pueden ser internas o externas y no se
recuperado o verificado en absoluto. Las URL de esquemas no compatibles también se consideran eliminadas.

EJEMPLOS


Consulte el sitio www.example.com, pero considere que cualquier ruta que contenga "/ webcheck" sea
externo.
webcheck http://www.example.com/ -x / webcheck

NOTAS


Al comprobar las URL internas, webcheck respeta el archivo robots.txt y se identifica como
webcheck de usuario-agente. Los enlaces no permitidos no se comprobarán en absoluto como si la opción -y estuviera
especificado para esa URL. Para permitir que webcheck rastree partes de un sitio que otros robots son
no permitido, use algo como:
Agente de usuario: *
Disallow: / foo

Agente de usuario: webcheck
Permitir: / foo

MEDIOAMBIENTE


_apoderado
URL de proxy para .

PRESENTACIÓN DE INFORMES LOCO


Los informes de errores deben enviarse a la lista de correowebcheck-users@lists.arthurdejong.org>.
Puede encontrar más información sobre cómo informar errores en la página de inicio de webcheck:
http://arthurdejong.org/webcheck/

DERECHOS DE AUTOR


Copyright © 1998, 1999 Albert Hopkins (marduk)
Derechos de autor © 2002 Mike W. Meyer
Copyright © 2005, 2006, 2007, 2008, 2009, 2010 Arthur de Jong
webcheck es un software gratuito; consulte la fuente para conocer las condiciones de copia. NO hay garantía;
ni siquiera para COMERCIABILIDAD o APTITUD PARA UN PROPÓSITO PARTICULAR.
Los archivos producidos como salida del software no se incluyen automáticamente en el
derechos de autor del software, a menos que se indique explícitamente lo contrario.

Utilice webcheck en línea utilizando los servicios de onworks.net


Ad


Ad