AnglaisFrançaisEspagnol

Ad


Icône de favori OnWorks

webcheck - En ligne dans le Cloud

Exécutez la vérification Web dans le fournisseur d'hébergement gratuit OnWorks sur Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

Il s'agit de la commande Webcheck qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks à l'aide de l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS.

PROGRAMME:

Nom


webcheck - vérificateur de liens de sites Web

SYNOPSIS


webcheck [OPTION] ... URL

DESCRIPTION


webcheck vérifiera le document à l'URL spécifiée pour les liens vers d'autres documents, suivez
ces liens de manière récursive et générer un rapport HTML.

-je, --interne=RECONNAISSANCE
Marquer les URL correspondant au RECONNAISSANCE (expression régulière de type perl) comme lien interne.
Peut être utilisé plusieurs fois. Notez que le PATTERN est comparé à l'URL complète.
Les URL correspondant à ce PATTERN seront considérées comme internes, même si elles correspondent à l'un des
les modèles --external.

-X, --externe=RECONNAISSANCE
Marquer les URL correspondant au RECONNAISSANCE (expression régulière de type perl) en tant que lien externe.
Peut être utilisé plusieurs fois. Notez que le PATTERN est comparé à l'URL complète.

-oui, --yank=RECONNAISSANCE
Ne vérifiez pas les URL correspondant au RECONNAISSANCE (expression régulière de type perl). Comme le -x
flag, bien que cette option empêchera webcheck de vérifier le lien correspondant à regex
alors que -x vérifiera le lien mais pas ses enfants. Peut être utilisé plusieurs fois.
Notez que le PATTERN est comparé à l'URL complète.

-b, --base-seulement
Considérez que toute URL ne commençant pas par l'URL de base est externe. Par exemple, si
vous courez
webcheck -b http://www.example.com/foo
puis http://www.example.com/foo/bar sera considéré comme interne alors que
http://www.example.com/ sera considérée comme externe. Par défaut toutes les pages sur
le site sera considéré comme interne.

-une, --éviter-externe
Évitez les liens externes. Normalement, si webcheck examine une page HTML et trouve
un lien qui pointe vers un document externe, il vérifiera si ce document externe
le document existe. Ce drapeau désactive cette action.

--ignorer-robots
Ne récupérez pas et n'analysez pas les fichiers robots.txt. Par défaut, les fichiers robots.txt sont
récupéré et honoré. Si vous êtes sûr de vouloir ignorer et remplacer le
décision du webmaster, cette option peut être utilisée.
Pour plus d'informations sur la gestion du fichier robots.txt, consultez la section NOTES ci-dessous.

-q, --calmer, --silencieux
N'imprimez pas la progression car Webcheck traverse un site.

-ré, --déboguer
Imprimez les informations de débogage lors de l'exploration du site. Cette option est principalement utile
pour les développeurs.

-o, --sortie=ANNUAIRE
Répertoire de sortie. Utilisez pour spécifier le répertoire où webcheck videra son
rapports. La valeur par défaut est le répertoire actuel ou tel que spécifié par config.py. Si ce
n'existe pas, il sera créé pour vous (si possible).

-c, --Continuez
Essayez de continuer à partir d'une exécution précédente. Lorsque vous utilisez cette option, Webcheck recherchera
un webcheck.dat dans le répertoire de sortie. Ce fichier est lu pour restaurer l'état
de la course précédente. Cela permet à Webcheck de poursuivre une opération précédemment interrompue.
Cours. Lorsque cette option est utilisée, les options --internal, --external et --yank
être ignoré ainsi que tous les arguments d'URL. Les options --base-only et --avoid-external
les options doivent être les mêmes que celles de l'exécution précédente.
Notez que cette option est expérimentale et que sa sémantique peut changer à venir
versions (en particulier par rapport à d'autres options). Notez également que le stocké
les fichiers ne sont pas garantis compatibles entre les versions.

-F, --Obliger
Écrasez les fichiers sans demander. Cette option est requise pour exécuter webcheck non-
de manière interactive.

-r, --redirections=N
Rediriger la profondeur. le nombre de redirections webcheck doit suivre lorsque vous suivez un
relier. 0 implique de suivre toutes les redirections.

-tu, --userpass=URL
Spécifiez une URL avec les informations de nom d'utilisateur et de mot de passe à utiliser pour la base
authentification lors de la visite du site.
par exemple http://test:[email protected]/
Cette option peut être spécifiée plusieurs fois.

-w, --attendre=SECONDS
Attendez SECONDS entre les récupérations de documents. Généralement, webcheck traitera une URL et
passer immédiatement au suivant. Cependant, sur certains systèmes chargés, il peut être souhaitable
pour que la vérification Web s'interrompe entre les demandes. Cette option peut être définie sur n'importe quel
nombre négatif.

-dans, --version
Afficher la version du programme.

-h, --Aidez-moi
Afficher un bref résumé des options.

URL HORAIRE


Les URL sont divisées en deux classes :

Interne Les URL sont récupérées et la syntaxe de l'élément récupéré est vérifiée. Également
l'élément récupéré est recherché pour les liens vers d'autres éléments (de n'importe quelle classe) et ces liens sont
ont suivi.

Externe Les URL ne sont récupérées que pour tester si elles sont valides et pour rassembler des informations de base
informations provenant d'eux (titre, taille, type de contenu, etc.). Les éléments récupérés ne sont pas
inspecté pour les liens vers d'autres éléments.

En dehors de leur classe, les URL peuvent également être considérées arraché (comme spécifié avec --yank
ou --avoid-options externes). Les URL peuvent être internes ou externes et ne seront pas
récupéré ou vérifié du tout. Les URL des schémas non pris en charge sont également considérées comme extraites.

EXEMPLES


Vérifiez le site www.example.com mais considérez que tout chemin contenant "/webcheck" est
externe.
webcheck http://www.example.com/ -x /vérification Web

NOTES


Lors de la vérification des URL internes, Webcheck respecte le fichier robots.txt, en s'identifiant comme
Webcheck de l'agent utilisateur. Les liens non autorisés ne seront pas du tout vérifiés comme si l'option -y était
spécifié pour cette URL. Pour permettre à webcheck d'explorer des parties d'un site que d'autres robots sont
interdit, utilisez quelque chose comme :
Agent utilisateur: *
Disallow: /toto

Agent utilisateur: webcheck
Autoriser: /toto

ENVIRONNEMENT


_Procuration
URL de proxy pour .

DE LA LIGNE BOGUES


Les rapports de bogues doivent être envoyés à la liste de diffusion[email protected]>.
Vous trouverez plus d'informations sur le signalement de bogues sur la page d'accueil de webcheck :
http://arthurdejong.org/webcheck/

DROIT D'AUTEUR


Copyright © 1998, 1999 Albert Hopkins (marduk)
Copyright © 2002 Mike W. Meyer
Copyright © 2005, 2006, 2007, 2008, 2009, 2010Arthur de Jong
webcheck est un logiciel gratuit ; voir la source pour les conditions de copie. Il n'y a AUCUNE garantie ;
même pas pour la QUALITÉ MARCHANDE ou l'ADAPTATION À UN USAGE PARTICULIER.
Les fichiers produits en sortie du logiciel ne relèvent pas automatiquement du
droit d'auteur du logiciel, sauf indication contraire explicite.

Utilisez webcheck en ligne à l'aide des services onworks.net


Serveurs et postes de travail gratuits

Télécharger des applications Windows et Linux

Commandes Linux

Ad