Il s'agit de l'application Linux nommée crawlee dont la dernière version peut être téléchargée sous le nom v3.5.8sourcecode.zip. Il peut être exécuté en ligne chez le fournisseur d'hébergement gratuit OnWorks pour les postes de travail.
Téléchargez et exécutez en ligne gratuitement cette application nommée crawlee avec OnWorks.
Suivez ces instructions pour exécuter cette application :
- 1. Téléchargé cette application sur votre PC.
- 2. Entrez dans notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous voulez.
- 3. Téléchargez cette application dans ce gestionnaire de fichiers.
- 4. Démarrez l'émulateur en ligne OnWorks Linux ou Windows en ligne ou l'émulateur en ligne MACOS à partir de ce site Web.
- 5. Depuis le système d'exploitation OnWorks Linux que vous venez de démarrer, accédez à notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous souhaitez.
- 6. Téléchargez l'application, installez-la et exécutez-la.
CAPTURES D'ÉCRAN
Ad
ramper
DESCRIPTION
Crawlee est une bibliothèque de grattage Web et d'automatisation de navigateur. Il vous aide à créer des robots d'exploration fiables. Rapide. Crawlee ne répare pas (encore) les sélecteurs défectueux pour vous, mais il vous aide à créer et à maintenir vos robots plus rapidement. Lorsqu'un site Web ajoute le rendu JavaScript, vous n'avez pas besoin de tout réécrire, passez simplement à l'un des robots d'exploration du navigateur. Lorsque vous trouverez plus tard une excellente API pour accélérer vos crawls, retournez le commutateur. Il maintient vos proxies en bonne santé en les faisant pivoter intelligemment avec de bonnes empreintes digitales qui donnent à vos robots une apparence humaine. Ce n'est pas imblocable, mais cela vous fera économiser de l'argent à long terme. Crawlee est construit par des personnes qui gagnent leur vie et l'utilisent tous les jours pour gratter des millions de pages. Rencontrez notre communauté sur Discord. Nous pensons que les sites Web sont mieux récupérés dans le langage dans lequel ils sont écrits. Crawlee s'exécute sur Node.js et est intégré à TypeScript pour améliorer la complétion du code dans votre IDE, même si vous n'utilisez pas TypeScript vous-même.
Fonctionnalités:
- JavaScript et TypeScript
- Extraction HTTP
- Navigateurs sans tête
- Mise à l'échelle automatique et gestion des proxys
- File d'attente et stockage
- Utilitaires utiles et configurabilité
Langage de programmation
Manuscrit
Catégories
Il s'agit d'une application qui peut également être récupérée sur https://sourceforge.net/projects/crawlee.mirror/. Il a été hébergé dans OnWorks afin d'être exécuté en ligne de la manière la plus simple à partir de l'un de nos systèmes d'exploitation gratuits.