Questa è l'app Linux chiamata crawlee, la cui ultima versione può essere scaricata come v3.15.0sourcecode.tar.gz. Può essere eseguita online sul provider di hosting gratuito OnWorks per workstation.
Scarica ed esegui online gratuitamente questa app denominata crawlee con OnWorks.
Segui queste istruzioni per eseguire questa app:
- 1. Scaricata questa applicazione sul tuo PC.
- 2. Entra nel nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 3. Carica questa applicazione in tale file manager.
- 4. Avviare l'emulatore online OnWorks Linux o Windows online o l'emulatore online MACOS da questo sito Web.
- 5. Dal sistema operativo OnWorks Linux che hai appena avviato, vai al nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 6. Scarica l'applicazione, installala ed eseguila.
IMMAGINI
Ad
crawlee
DESCRIZIONE
Crawlee è una libreria di web scraping e automazione del browser. Ti aiuta a creare crawler affidabili. Veloce. Crawlee non risolverà per te i selettori danneggiati (ancora), ma ti aiuta a creare e mantenere i tuoi crawler più velocemente. Quando un sito Web aggiunge il rendering JavaScript, non è necessario riscrivere tutto, basta passare a uno dei crawler del browser. Quando in seguito trovi un'ottima API per accelerare le tue scansioni, riporta indietro l'interruttore. Mantiene sani i tuoi proxy ruotandoli in modo intelligente con buone impronte digitali che fanno sembrare i tuoi crawler simili a quelli umani. Non è sbloccabile, ma ti farà risparmiare denaro a lungo termine. Crawlee è costruito da persone che si guadagnano da vivere e lo usano ogni giorno per racimolare milioni di pagine. Incontra la nostra community su Discord. Riteniamo che i siti Web siano meglio raschiati nella lingua in cui sono scritti. Crawlee funziona su Node.js ed è integrato in TypeScript per migliorare il completamento del codice nel tuo IDE, anche se non utilizzi TypeScript tu stesso.
Caratteristiche
- JavaScript e TypeScript
- Scraping HTTP
- Browser senza testa
- Ridimensionamento automatico e gestione proxy
- Coda e archiviazione
- Utilità utili e configurabilità
Linguaggio di programmazione
Dattiloscritto
Categorie
Questa è un'applicazione che può essere recuperata anche da https://sourceforge.net/projects/crawlee.mirror/. È stato ospitato su OnWorks per poter essere eseguito online in modo più semplice da uno dei nostri sistemi operativi gratuiti.