Dit is de commando-webcheck die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online-emulator of MAC OS online-emulator
PROGRAMMA:
NAAM
webcheck - websitelinkcontrole
KORTE INHOUD
webcheck [OPTIE] ... URL
PRODUCTBESCHRIJVING
webcheck zal het document op de opgegeven URL controleren op links naar andere documenten, volg
deze links recursief en genereren een HTML-rapport.
-l, --intern=PATROON
Markeer URL's die overeenkomen met de PATROON (perl-type reguliere expressie) als een interne link.
Kan meerdere keren gebruikt worden. Merk op dat het PATTERN wordt vergeleken met de volledige URL.
URL's die overeenkomen met dit PATTERN, worden als intern beschouwd, zelfs als ze overeenkomen met een van de URL's
de --externe PATRONEN.
-X, --extern=PATROON
Markeer URL's die overeenkomen met de PATROON (perl-type reguliere expressie) als een externe link.
Kan meerdere keren gebruikt worden. Merk op dat het PATTERN wordt vergeleken met de volledige URL.
-ja, --jank=PATROON
Controleer geen URL's die overeenkomen met de PATROON (perl-type reguliere expressie). Zoals de -x
vlag, hoewel deze optie ervoor zorgt dat webcheck de link die overeenkomt met regex niet controleert
terwijl -x de link controleert, maar niet de kinderen. Kan meerdere keren gebruikt worden.
Merk op dat het PATTERN wordt vergeleken met de volledige URL.
-B, --alleen basis
Beschouw elke URL die niet begint met de basis-URL als extern. Als bijvoorbeeld
jij rent
webcheck -b http://www.example.com/foo
harte http://www.example.com/foo/bar wordt als intern beschouwd terwijl
http://www.example.com/ wordt als extern beschouwd. Standaard staan alle pagina's op
de site wordt als intern beschouwd.
-een, --vermijd-extern
Vermijd externe links. Normaal gesproken als webcheck een HTML-pagina onderzoekt en vindt
een link die naar een extern document verwijst, zal het controleren of dat extern
document bestaat. Deze vlag schakelt die actie uit.
--negeer-robots
Haal geen robots.txt-bestanden op en parseer ze niet. Standaard zijn robots.txt-bestanden
opgehaald en geëerd. Als u zeker weet dat u de
beslissing van de webmaster kan deze optie worden gebruikt.
Zie het gedeelte OPMERKINGEN hieronder voor meer informatie over het omgaan met robots.txt.
-Q, --stil, --stil
Druk de voortgang niet af aangezien de webcheck een site doorkruist.
-NS, --debuggen
Foutopsporingsinformatie afdrukken tijdens het crawlen van de site. Deze optie is vooral handig
voor ontwikkelaars.
-O, --uitvoer=DIRECTORY
Uitvoermap. Gebruik om de map te specificeren waar webcheck zijn zal dumpen
rapporten. De standaard is de huidige map of zoals gespecificeerd door config.py. Als dit
directory niet bestaat, wordt deze voor u aangemaakt (indien mogelijk).
-C, --doorgaan met
Probeer verder te gaan vanaf een vorige run. Bij gebruik van deze optie zal webcheck zoeken
een webcheck.dat in de uitvoerdirectory. Dit bestand wordt gelezen om de status te herstellen
van de vorige run. Hierdoor kan webcheck doorgaan met een eerder onderbroken
loop. Wanneer deze optie wordt gebruikt, zullen de --internal, --external en --yank opties dat doen
worden genegeerd, evenals eventuele URL-argumenten. De --base-only en --avoid-external
opties moeten hetzelfde zijn als de vorige run.
Merk op dat deze optie experimenteel is en dat de semantiek ervan met de komst kan veranderen
releases (vooral met betrekking tot andere opties). Merk ook op dat de opgeslagen
bestanden zijn niet gegarandeerd compatibel tussen releases.
-F, --kracht
Overschrijf bestanden zonder te vragen. Deze optie is vereist voor het uitvoeren van webcheck niet-
interactief.
-R, --omleidingen=N
Diepte omleiden. het aantal omleidingen webcheck moet volgen bij het volgen van een
koppeling. 0 houdt in dat je alle omleidingen moet volgen.
-u, --gebruikerspas=URL
Geef een URL op met gebruikersnaam en wachtwoord voor basisgebruik
authenticatie bij een bezoek aan de site.
bv http://test:[e-mail beveiligd]/
Deze optie kan meerdere keren worden opgegeven.
-w, --wacht=SECONDS
Wacht SECONDS tussen het ophalen van documenten. Meestal verwerkt webcheck een url en
meteen door naar de volgende. Op sommige belaste systemen kan het echter wenselijk zijn
om webcheck te laten pauzeren tussen verzoeken. Deze optie kan worden ingesteld op elke niet-
negatief nummer.
-in, --versie
Toon versie van het programma.
-H, --help
Toon korte samenvatting van opties.
URL KLASSEN
URL's zijn onderverdeeld in twee klassen:
Intern URL's worden opgehaald en het opgehaalde item wordt gecontroleerd op syntaxis. Ook de
opgehaald item wordt gezocht naar links naar andere items (van welke klasse dan ook) en deze links zijn
gevolgd.
Extern URL's worden alleen opgehaald om te testen of ze geldig zijn en om wat basis te verzamelen
informatie van hen (titel, grootte, inhoudstype, enz.). De opgehaalde items zijn dat niet
geïnspecteerd op links naar andere items.
Afgezien van hun klasse, kunnen ook URL's worden overwogen rukte (zoals gespecificeerd met de --yank
of --avoid-externe opties). De URL's kunnen intern of extern zijn en zullen dat niet zijn
teruggevonden of gecontroleerd. URL's van niet-ondersteunde schema's worden ook als gehackt beschouwd.
Voorbeelden
Controleer de site www.example.com maar overweeg elk pad met "/webcheck" erin
extern.
webcheck http://www.example.com/ -x /webcheck
OPMERKINGEN
Bij het controleren van interne URL's respecteert webcheck het robots.txt-bestand en identificeert zichzelf als
user-agent webcheck. Niet-toegestane links worden helemaal niet gecontroleerd alsof de optie -y dat wel was
opgegeven voor die URL. Om webcheck toe te staan delen van een site te crawlen die andere robots zijn
niet toegestaan, gebruik zoiets als:
User-agent: *
Disallow: /foe
User-agent: webcheck
Toestaan: /foe
MILIEU
_volmacht
Proxy-URL voor .
RAPPORTAGE BUGS
Bugrapporten moeten naar de mailinglijst worden gestuurd[e-mail beveiligd]>.
Meer informatie over het melden van bugs vindt u op de homepage van de webcheck:
http://arthurdejong.org/webcheck/
COPYRIGHT
Copyright © 1998, 1999 Albert Hopkins (marduk)
Auteursrecht © 2002 Mike W. Meyer
Auteursrecht © 2005, 2006, 2007, 2008, 2009, 2010 Arthur de Jong
webcheck is gratis software; zie de bron voor kopieervoorwaarden. Er is GEEN garantie;
zelfs niet voor VERKOOPBAARHEID of GESCHIKTHEID VOOR EEN BEPAALD DOEL.
De bestanden die als uitvoer van de software worden geproduceerd, vallen niet automatisch onder de
copyright van de software, tenzij uitdrukkelijk anders vermeld.
Gebruik webcheck online met behulp van onworks.net-services