Questo è il comando webcheck che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici postazioni di lavoro online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
webcheck - controllo del collegamento al sito web
SINOSSI
controllo web [OPZIONE] ... URL
DESCRIZIONE
controllo web controllerà il documento all'URL specificato per i collegamenti ad altri documenti, seguire
questi collegamenti ricorsivamente e generano un report HTML.
-io, --interno=MODELLO
Segna gli URL che corrispondono a MODELLO (espressione regolare di tipo perl) come collegamento interno.
Può essere utilizzato più volte. Nota che il PATTERN viene confrontato con l'URL completo.
Gli URL che corrispondono a questo PATTERN saranno considerati interni, anche se corrispondono a uno di
i --external PATTERN.
-X, --esterno=MODELLO
Segna gli URL che corrispondono a MODELLO (espressione regolare di tipo perl) come collegamento esterno.
Può essere utilizzato più volte. Nota che il PATTERN viene confrontato con l'URL completo.
-sì, --strappo=MODELLO
Non controllare gli URL che corrispondono a MODELLO (espressione regolare di tipo perl). Come il -x
flag, anche se questa opzione farà sì che webcheck non controlli il collegamento abbinato da regex
mentre -x controllerà il collegamento ma non i suoi figli. Può essere utilizzato più volte.
Nota che il PATTERN viene confrontato con l'URL completo.
-B, --solo base
Considera qualsiasi URL che non inizia con l'URL di base come esterno. Ad esempio, se
tu corri
controllo web -b http://www.example.com/foo
poi http://www.example.com/foo/bar sarà considerato interno mentre
http://www.example.com/ sarà considerato esterno. Per impostazione predefinita tutte le pagine attive
il sito sarà considerato interno.
-un, --evita-esterno
Evita i link esterni. Normalmente se webcheck sta esaminando una pagina HTML e trova
un collegamento che punta a un documento esterno, controllerà per vedere se quello esterno
documento esiste. Questo flag disabilita quell'azione.
--ignora-robot
Non recuperare e analizzare i file robots.txt. Per impostazione predefinita, i file robots.txt sono
recuperato e onorato. Se sei sicuro di voler ignorare e sovrascrivere il
decisione del webmaster questa opzione può essere utilizzata.
Per ulteriori informazioni sulla gestione di robots.txt, vedere la sezione NOTE di seguito.
-Q, --calmatevi, --silenzioso
Non stampare i progressi mentre il webcheck attraversa un sito.
-D, - debug
Stampa le informazioni di debug durante la scansione del sito. Questa opzione è principalmente utile
per gli sviluppatori.
-oh, --uscita=DIRECTORY
Cartella di destinazione. Utilizzare per specificare la directory in cui webcheck eseguirà il dump del suo
rapporti. L'impostazione predefinita è la directory corrente o come specificato da config.py. Se questo
la directory non esiste verrà creata per te (se possibile).
-C, --Continua
Prova a continuare da una corsa precedente. Quando si utilizza questa opzione, il webcheck cercherà
un webcheck.dat nella directory di output. Questo file viene letto per ripristinare lo stato
dalla corsa precedente. Ciò consente al webcheck di continuare un'interruzione precedentemente interrotta
correre. Quando viene utilizzata questa opzione, le opzioni --internal, --external e --yank saranno
essere ignorato così come qualsiasi argomento URL. Il --base-only e --avoid-external
le opzioni dovrebbero essere le stesse dell'esecuzione precedente.
Nota che questa opzione è sperimentale e la sua semantica potrebbe cambiare con l'arrivo
rilasci (soprattutto in relazione ad altre opzioni). Si noti inoltre che il memorizzato
non è garantito che i file siano compatibili tra le versioni.
-F, --vigore
Sovrascrivi i file senza chiedere. Questa opzione è necessaria per l'esecuzione di webcheck non
in modo interattivo.
-R, --redirect=N
Reindirizza la profondità. il numero di reindirizzamenti webcheck dovrebbe seguire quando si segue a
collegamento. 0 implica seguire tutti i reindirizzamenti.
-tu, --passutente=URL
Specifica un URL con le informazioni su nome utente e password da utilizzare per le attività di base
autenticazione quando si visita il sito.
per esempio http://test:[email protected]/
Questa opzione può essere specificata più volte.
-w, --aspetta=SECONDI
Aspetta! SECONDI tra i recuperi di documenti. Di solito webcheck elaborerà un URL e
passare subito al successivo. Tuttavia su alcuni sistemi caricati potrebbe essere desiderabile
per mettere in pausa il webcheck tra le richieste. Questa opzione può essere impostata su qualsiasi
numero negativo.
-in, --versione
Mostra la versione del programma.
-H, --Aiuto
Mostra un breve riepilogo delle opzioni.
URL CLASSI
Gli URL sono divisi in due classi:
Interno Gli URL vengono recuperati e la sintassi dell'elemento recuperato viene controllata. Anche il
l'elemento recuperato viene cercato per i collegamenti ad altri elementi (di qualsiasi classe) e questi collegamenti sono
seguita.
Esterno Gli URL vengono recuperati solo per verificare se sono validi e per raccogliere alcune informazioni di base
informazioni da loro (titolo, dimensione, tipo di contenuto, ecc.). Gli elementi recuperati non lo sono
ispezionato per i collegamenti ad altri elementi.
Oltre alla loro classe, possono essere presi in considerazione anche gli URL strattonato (come specificato con --yank
o --avoid-external opzioni). Gli URL possono essere interni o esterni e non lo saranno
recuperato o controllato del tutto. Anche gli URL di schemi non supportati sono considerati yank.
ESEMPI
Controlla il sito www.example.com ma considera qualsiasi percorso con "/webcheck" in esso essere
esterno.
controllo web http://www.example.com/ -x /webcheck
NOTE
Quando si controllano gli URL interni, il webcheck rispetta il file robots.txt, identificandosi come
webcheck user-agent. I collegamenti non consentiti non verranno affatto controllati come se l'opzione -y fosse
specificato per quell'URL. Per consentire al webcheck di eseguire la scansione di parti di un sito che altri robot sono
non consentito, usa qualcosa come:
Agente utente: *
Disallow: /pippo
Agente utente: controllo web
Permettere: /pippo
AMBIENTE
_proxy
URL proxy per .
REPORTING BUG
Le segnalazioni di bug devono essere inviate alla mailing list[email protected]>.
Maggiori informazioni sulla segnalazione di bug possono essere trovate sulla homepage del webcheck:
http://arthurdejong.org/webcheck/
COPYRIGHT
Copyright © 1998, 1999 Albert Hopkins (marduk)
Copyright © 2002 Mike W. Meyer
Copyright © 2005, 2006, 2007, 2008, 2009, 2010Arthur de Jong
webcheck è un software gratuito; vedere la fonte per le condizioni di copia. NON c'è garanzia;
nemmeno per COMMERCIABILITÀ o IDONEITÀ PER UN PARTICOLARE SCOPO.
I file prodotti come output dal software non rientrano automaticamente nella
copyright del software, se non diversamente specificato.
Utilizzare il webcheck online utilizzando i servizi onworks.net