Questa è l'app Windows denominata crwlr la cui ultima versione può essere scaricata come v1.2.2.zip. Può essere eseguito online nel provider di hosting gratuito OnWorks per workstation.
Scarica ed esegui online questa app denominata crwlr con OnWorks gratuitamente.
Segui queste istruzioni per eseguire questa app:
- 1. Scaricata questa applicazione sul tuo PC.
- 2. Entra nel nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 3. Carica questa applicazione in tale file manager.
- 4. Avvia qualsiasi emulatore online OS OnWorks da questo sito Web, ma migliore emulatore online Windows.
- 5. Dal sistema operativo OnWorks Windows che hai appena avviato, vai al nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 6. Scarica l'applicazione e installala.
- 7. Scarica Wine dai repository software delle tue distribuzioni Linux. Una volta installato, puoi quindi fare doppio clic sull'app per eseguirli con Wine. Puoi anche provare PlayOnLinux, un'interfaccia fantasiosa su Wine che ti aiuterà a installare programmi e giochi Windows popolari.
Wine è un modo per eseguire il software Windows su Linux, ma senza Windows richiesto. Wine è un livello di compatibilità Windows open source in grado di eseguire programmi Windows direttamente su qualsiasi desktop Linux. Essenzialmente, Wine sta cercando di re-implementare abbastanza Windows da zero in modo che possa eseguire tutte quelle applicazioni Windows senza effettivamente bisogno di Windows.
IMMAGINI
Ad
crwlr
DESCRIZIONE
Questa libreria fornisce una sorta di struttura e molti cosiddetti passaggi pronti all'uso, che puoi utilizzare come elementi costitutivi con cui costruire i tuoi crawler e scraper. Prima di immergerci nella biblioteca, diamo un'occhiata ai termini strisciare e raschiare. Per la maggior parte dei casi d'uso del mondo reale, queste due cose vanno di pari passo, motivo per cui questa libreria aiuta e combina entrambe. Un crawler (web) è un programma che (scarica) documenti e segue i collegamenti in esso contenuti per caricarli. Un crawler potrebbe semplicemente caricare effettivamente tutti i collegamenti che sta trovando (e gli è consentito caricarli in base al file robots.txt), quindi caricherebbe semplicemente l'intera Internet (se gli URL con cui inizia non sono un vicolo cieco). Oppure può essere limitato al caricamento solo dei collegamenti che corrispondono a determinati criteri (sullo stesso dominio/host, il percorso dell'URL inizia con "/foo",...) o solo a una certa profondità. Una profondità di 3 significa 3 livelli di profondità. I collegamenti trovati sugli URL iniziali forniti al crawler sono di livello 1 e così via.
Caratteristiche
- Crawler Politeness (rispettando robots.txt, limitazioni,...)
- Ottieni collegamenti assoluti da documenti HTML
- Ottieni le mappe dei siti da robots.txt e ottieni tutti gli URL da tali mappe dei siti
- Scansiona (carica) tutte le pagine di un sito web
- Utilizza qualsiasi metodo HTTP (GET, POST,...) e invia eventuali intestazioni o corpo
- Iterare sulle pagine dell'elenco impaginato
Linguaggio di programmazione
PHP
Categorie
Questa è un'applicazione che può essere recuperata anche da https://sourceforge.net/projects/crwlr.mirror/. È stato ospitato su OnWorks per poter essere eseguito online in modo più semplice da uno dei nostri sistemi operativi gratuiti.