Il s'agit de l'application Linux nommée Grab Framework Project dont la dernière version peut être téléchargée en tant que v0.6.40.zip. Il peut être exécuté en ligne dans le fournisseur d'hébergement gratuit OnWorks pour les postes de travail.
Téléchargez et exécutez gratuitement en ligne cette application nommée Grab Framework Project avec OnWorks.
Suivez ces instructions pour exécuter cette application :
- 1. Téléchargé cette application sur votre PC.
- 2. Entrez dans notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous voulez.
- 3. Téléchargez cette application dans ce gestionnaire de fichiers.
- 4. Démarrez l'émulateur en ligne OnWorks Linux ou Windows en ligne ou l'émulateur en ligne MACOS à partir de ce site Web.
- 5. Depuis le système d'exploitation OnWorks Linux que vous venez de démarrer, accédez à notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous souhaitez.
- 6. Téléchargez l'application, installez-la et exécutez-la.
CAPTURES D'ÉCRAN
Ad
Projet de cadre Grab
DESCRIPTION
Grab est un framework python pour créer des scrapers Web. Avec Grab, vous pouvez créer des scrapers Web de complexité variée, allant de simples scripts de 5 lignes à des robots d'exploration de sites Web asynchrones complexes traitant des millions de pages Web. Grab fournit une API pour effectuer des requêtes réseau et pour gérer le contenu reçu, par exemple interagir avec l'arborescence DOM du document HTML. L'API de requête/réponse unique qui vous permet de créer une requête réseau, de l'exécuter et de travailler avec le contenu reçu. L'API est construite sur les bibliothèques urllib3 et lxml. L'API Spider pour créer des robots d'exploration Web asynchrones. Vous écrivez des classes qui définissent des gestionnaires pour chaque type de requête réseau. Chaque gestionnaire est capable de générer de nouvelles requêtes réseau. Les requêtes réseau sont traitées simultanément avec un pool de sockets Web asynchrones. Grab fournit une interface appelée Spider pour développer des grattoirs de sites Web multithreads.
Fonctionnalités:
- Prise en charge des cookies automatiques (session)
- Prise en charge du proxy HTTPS/SOCKS avec/sans authentification
- Prise en charge des IDN
- Outils pour travailler avec les formulaires Web
- Téléchargement facile de fichiers en plusieurs parties
- Personnalisation flexible des requêtes HTTP
Langage de programmation
Python
Catégories
Il s'agit d'une application qui peut également être récupérée à partir de https://sourceforge.net/projects/grab-framework-project.mirror/. Il a été hébergé dans OnWorks afin d'être exécuté en ligne de la manière la plus simple à partir de l'un de nos systèmes d'exploitation gratuits.