EnglischFranzösischSpanisch

Ad


OnWorks-Favicon

webcheck - Online in der Cloud

Führen Sie den Webcheck im kostenlosen Hosting-Anbieter OnWorks über Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator aus

Dies ist der Befehl Webcheck, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


Webcheck – Website-Link-Checker

ZUSAMMENFASSUNG


Webcheck [zur Auswahl] ... URL

BESCHREIBUNG


Webcheck prüft das Dokument unter der angegebenen URL auf Links zu anderen Dokumenten, folgen Sie
rekursiv diese Links und generiert einen HTML-Bericht.

-ich, --internal=MUSTER
Markieren Sie URLs, die mit dem übereinstimmen MUSTER (regulärer Ausdruck vom Typ Perl) als interner Link.
Kann mehrfach verwendet werden. Beachten Sie, dass das MUSTER mit der vollständigen URL abgeglichen wird.
URLs, die diesem MUSTER entsprechen, werden als intern betrachtet, auch wenn sie mit einem davon übereinstimmen
die --external MUSTER.

-X, --external=MUSTER
Markieren Sie URLs, die mit dem übereinstimmen MUSTER (regulärer Ausdruck vom Perl-Typ) als externen Link.
Kann mehrfach verwendet werden. Beachten Sie, dass das MUSTER mit der vollständigen URL abgeglichen wird.

-Und, --yank=MUSTER
Überprüfen Sie keine URLs, die mit dem übereinstimmen MUSTER (regulärer Ausdruck vom Perl-Typ). Wie das -x
Flag, obwohl diese Option dazu führt, dass Webcheck den mit Regex übereinstimmenden Link nicht überprüft
wohingegen -x den Link überprüft, nicht jedoch seine untergeordneten Elemente. Kann mehrfach verwendet werden.
Beachten Sie, dass das MUSTER mit der vollständigen URL abgeglichen wird.

-B, --base-only
Betrachten Sie jede URL, die nicht mit der Basis-URL beginnt, als extern. Zum Beispiel, wenn
Sie laufen
Webcheck -b http://www.example.com/foo
dann http://www.example.com/foo/bar wird als intern betrachtet, während
http://www.example.com/ wird als extern betrachtet. Standardmäßig sind alle Seiten aktiviert
Die Website wird als intern betrachtet.

-a, --avoid-external
Vermeiden Sie externe Links. Normalerweise, wenn Webcheck eine HTML-Seite untersucht und findet
einen Link, der auf ein externes Dokument verweist, wird geprüft, ob es sich um ein externes Dokument handelt
Dokument existiert. Dieses Flag deaktiviert diese Aktion.

--ignore-robots
Rufen Sie keine robots.txt-Dateien ab und analysieren Sie sie nicht. Standardmäßig sind es robots.txt-Dateien
abgeholt und geehrt. Wenn Sie sicher sind, dass Sie das ignorieren und überschreiben möchten
Nach der Entscheidung des Webmasters kann diese Option genutzt werden.
Weitere Informationen zur Handhabung von robots.txt finden Sie im Abschnitt „HINWEISE“ weiter unten.

-Q, --ruhig, --Leise
Drucken Sie den Fortschritt nicht aus, während Webcheck eine Site durchläuft.

-D, --debuggen
Drucken Sie Debugging-Informationen beim Crawlen der Site. Diese Option ist hauptsächlich nützlich
für Entwickler.

-Ö, --ausgabe=DIRECTORY
Ausgabe Verzeichnis. Verwenden Sie diese Option, um das Verzeichnis anzugeben, in dem Webcheck es ablegt
Berichte. Der Standardwert ist das aktuelle Verzeichnis oder wie in config.py angegeben. Wenn dies
Wenn das Verzeichnis nicht existiert, wird es für Sie erstellt (falls möglich).

-C, --fortsetzen
Versuchen Sie, mit einem vorherigen Lauf fortzufahren. Bei Verwendung dieser Option sucht Webcheck nach
eine webcheck.dat im Ausgabeverzeichnis. Diese Datei wird gelesen, um den Zustand wiederherzustellen
aus dem vorherigen Lauf. Dadurch kann Webcheck einen zuvor unterbrochenen Vorgang fortsetzen
laufen. Wenn diese Option verwendet wird, werden die Optionen --internal, --external und --yank verwendet
ignoriert werden, ebenso wie alle URL-Argumente. Das --base-only und --avoid-external
Die Optionen sollten mit denen des vorherigen Laufs identisch sein.
Beachten Sie, dass diese Option experimentell ist und sich ihre Semantik mit der Zeit ändern kann
Veröffentlichungen (insbesondere in Bezug auf andere Optionen). Beachten Sie auch, dass die gespeicherten
Es kann nicht garantiert werden, dass die Dateien zwischen den Versionen kompatibel sind.

-F, --Macht
Überschreiben Sie Dateien ohne zu fragen. Diese Option ist für die Ausführung von Webcheck nicht erforderlich.
interaktiv.

-R, --redirects=N
Tiefe umleiten. Die Anzahl der Weiterleitungen sollte beim Webcheck berücksichtigt werden, wenn a
Verknüpfung. 0 bedeutet, allen Weiterleitungen zu folgen.

-du, --userpass=URL
Geben Sie eine URL mit Benutzernamen und Passwortinformationen an, die für Basic verwendet werden soll
Authentifizierung beim Besuch der Website.
z.B http://test:[E-Mail geschützt] /
Diese Option kann mehrfach angegeben werden.

-w, --warte=SECONDS
Wartezeit SECONDS zwischen Dokumentenabrufen. Normalerweise verarbeitet Webcheck eine URL und
Fahren Sie sofort mit dem nächsten fort. Auf einigen ausgelasteten Systemen kann dies jedoch wünschenswert sein
um den Webcheck zwischen Anfragen pausieren zu lassen. Diese Option kann auf einen beliebigen Nicht-Wert eingestellt werden.
negative Zahl.

-in, --Version
Programmversion anzeigen.

-H, --help
Kurze Zusammenfassung der Optionen anzeigen.

URL KLASSEN


URLs werden in zwei Klassen unterteilt:

Intern URLs werden abgerufen und das abgerufene Element wird auf Syntax überprüft. Auch der
Das abgerufene Element wird nach Links zu anderen Elementen (jeglicher Klasse) durchsucht, und diese Links sind vorhanden
gefolgt.

Extern URLs werden nur abgerufen, um zu testen, ob sie gültig sind, und um einige grundlegende Informationen zu sammeln
Informationen daraus (Titel, Größe, Inhaltstyp usw.). Die abgerufenen Elemente sind es nicht
auf Links zu anderen Artikeln überprüft.

Neben ihrer Klasse können auch URLs berücksichtigt werden riss (wie mit --yank angegeben
oder --avoid-external Optionen). Die URLs können entweder intern oder extern sein und werden es nicht sein
überhaupt abgerufen oder überprüft werden. URLs nicht unterstützter Schemata gelten ebenfalls als gelöscht.

Beispiele:


Sehen Sie sich die Website www.example.com an, berücksichtigen Sie jedoch jeden Pfad, der „/webcheck“ enthält
extern.
Webcheck http://www.example.com/ -x /webcheck

ANMERKUNG


Bei der Überprüfung interner URLs berücksichtigt Webcheck die robots.txt-Datei und identifiziert sich als
User-Agent-Webcheck. Unzulässige Links werden überhaupt nicht überprüft, als ob die Option -y vorhanden wäre
für diese URL angegeben. Damit Webcheck Teile einer Website crawlen kann, die von anderen Robots erfasst werden
nicht zulässig, verwenden Sie etwas wie:
User-Agent: *
Disallow: / foo

User-Agent: Webcheck
Ermöglichen: / foo


_proxy
Proxy-URL für .

REPORTING Fehler


Fehlerberichte sollten an die Mailingliste gesendet werden[E-Mail geschützt] >.
Weitere Informationen zum Melden von Fehlern finden Sie auf der Webcheck-Homepage:
http://arthurdejong.org/webcheck/

COPYRIGHT


Copyright © 1998, 1999 Albert Hopkins (marduk)
Copyright © 2002 Mike W. Meyer
Urheberrecht © 2005, 2006, 2007, 2008, 2009, 2010 Arthur de Jong
Webcheck ist kostenlose Software; Die Kopierbedingungen finden Sie in der Quelle. Es gibt KEINE Garantie;
nicht einmal für MARKTGÄNGIGKEIT oder EIGNUNG FÜR EINEN BESTIMMTEN ZWECK.
Die als Ausgabe der Software erzeugten Dateien fallen nicht automatisch unter die
Urheberrecht an der Software, sofern nicht ausdrücklich anders angegeben.

Nutzen Sie Webcheck online über die Dienste von onworks.net


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad