estwaver – Online in der Cloud

Dies ist der Befehl estwaver, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


estwaver – Befehlszeilenschnittstelle des Webcrawlers

ZUSAMMENFASSUNG


estwaver init [-apn|-acc] [-xs|-xl|-xh] [-sv|-si|-sa] Rootdir

estwaver kriechen [-restart|-revisit|-revcont] Rootdir

estwaver Gerätetest Rootdir

estwaver holen [-proxy Hostr Hafen] [-Schlepper Anzahl] [-il lang] URL

BESCHREIBUNG


estwaver ist eine Ansammlung von Unterbefehlen. Der Name eines Unterbefehls wird durch angegeben
erstes Argument. Andere Argumente werden entsprechend jedem Unterbefehl analysiert. Das Argument
Rootdir Gibt das Crawler-Stammverzeichnis an, das die Konfigurationsdatei usw. enthält.

estwaver init [-apn|-acc] [-xs|-xl|-xh] [-sv|-si|-sa] Rootdir
Erstellen Sie das Crawler-Stammverzeichnis.
If -apn angegeben ist, wird die N-Gramm-Analyse auch für europäischen Text durchgeführt.
If - gem angegeben ist, wird anstelle der N-Gramm-Analyse eine Zeichenkategorieanalyse durchgeführt
Analyse.
If -xs angegeben ist, wird der Index so optimiert, dass weniger als 50000 Dokumente registriert werden.
If -xl angegeben ist, ist der Index auf die Registrierung von mehr als 300000 Dokumenten abgestimmt.
If -xh angegeben ist, ist der Index auf die Registrierung von mehr als 1000000 Dokumenten abgestimmt.
If -sv angegeben ist, werden die Ergebnisse als ungültig gespeichert.
If -Ja angegeben ist, werden die Ergebnisse als 32-Bit-Ganzzahl gespeichert.
If -Sa angegeben ist, werden die Partituren unverändert gespeichert und markiert, damit sie nicht angepasst werden können
Suche.

estwaver kriechen [-restart|-revisit|-revcont] Rootdir
Fangen Sie an zu kriechen.
If -neu starten angegeben ist, wird das Crawlen ab den Seed-Dokumenten neu gestartet.
If - erneut besuchen angegeben wird, werden gesammelte Dokumente erneut gesichtet.
If -revcont angegeben wird, werden die gesammelten Dokumente erneut durchsucht und anschließend gecrawlt
Fortsetzung.

estwaver Gerätetest Rootdir
Führen Sie Unit-Tests durch.

estwaver holen [-proxy Hostr Hafen] [-Schlepper Anzahl] [-il lang] URL
Holen Sie sich ein Dokument.
URL Gibt die URL eines Dokuments an.
-Proxy Gibt den Hostnamen und die Portnummer des Proxyservers an.
-Schlepper Gibt den Timeout in Sekunden an.
es Gibt die bevorzugte Sprache an. Standardmäßig ist es Englisch.

Alle Unterbefehle geben 0 zurück, wenn der Vorgang erfolgreich ist, andernfalls 1. Ein laufender Crawler
schließt das Schließen der Datenbank ab, wenn das Signal 1 (SIGHUP), 2 (SIGINT), 3 empfangen wird
(SIGQUIT) oder 15 (SIGTERM).

Wenn das Crawlen abgeschlossen ist, gibt es ein Verzeichnis _Index im Root-Verzeichnis des Crawlers. Es ist
ein Index verfügbar von estcmd und so weiter.

Nutzen Sie estwaver online über die Dienste von onworks.net



Neueste Linux- und Windows-Online-Programme