estwaver - Online nel cloud

Questo è il comando estwaver che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

PROGRAMMA:

NOME


estwaver - interfaccia a riga di comando del web crawler

SINOSSI


estwaver init [-apn|-ac] [-xs|-xl|-xh] [-sv|-si|-sa] rootdir

estwaver strisciare [-restart|-revisit|-revcont] rootdir

estwaver unittest rootdir

estwaver andare a prendere [-procura hostr porta] [-tutto numero] [-I l lingua] URL

DESCRIZIONE


estwaver è un'aggregazione di sottocomandi. Il nome di un sottocomando è specificato da
primo argomento. Altri argomenti vengono analizzati in base a ciascun sottocomando. L'argomento
rootdir specifica la directory root del crawler che contiene il file di configurazione e così via.

estwaver init [-apn|-ac] [-xs|-xl|-xh] [-sv|-si|-sa] rootdir
Crea la directory principale del crawler.
If -ap viene specificato, l'analisi degli N-grammi viene eseguita anche rispetto al testo europeo.
If -acc viene specificato, viene eseguita l'analisi della categoria di caratteri al posto di N-gram
analisi.
If -xs viene specificato, l'indice viene regolato per registrare meno di 50000 documenti.
If -XL è specificato, l'indice è sintonizzato per registrare più di 300000 documenti.
If -xh è specificato, l'indice è sintonizzato per registrare più di 1000000 documenti.
If -sv è specificato, i punteggi vengono memorizzati come void.
If -e è specificato, i punteggi vengono archiviati come interi a 32 bit.
If -sa è specificato, i punteggi vengono memorizzati così come sono e contrassegnati per non essere sintonizzati quando
ricerca.

estwaver strisciare [-restart|-revisit|-revcont] rootdir
Inizia a gattonare.
If -ricomincia è specificato, la scansione viene riavviata dai documenti seed.
If -rivisitare viene specificato, i documenti raccolti vengono rivisitati.
If -revcont è specificato, i documenti raccolti vengono rivisitati e quindi viene eseguita la scansione
continua.

estwaver unittest rootdir
Eseguire test unitari.

estwaver andare a prendere [-procura hostr porta] [-tutto numero] [-I l lingua] URL
Prendi un documento.
URL specifica l'URL di un documento.
- proxy specifica il nome host e il numero di porta del server proxy.
-Tout specifica il timeout in secondi.
-egli specifica la lingua preferita. Per impostazione predefinita, è l'inglese.

Tutti i sottocomandi restituiscono 0 se l'operazione ha esito positivo, altrimenti restituiscono 1. Un crawler in esecuzione
termina con la chiusura del database quando rileva il segnale 1 (SIGHUP), 2 (SIGINT), 3
(SIGQUIT) o 15 (SIGTERM).

Al termine della scansione, è presente una directory _indice nella directory principale del crawler. È
un indice disponibile da estcmd e così via.

Utilizza estwaver online utilizzando i servizi onworks.net



Gli ultimi programmi online per Linux e Windows