Il s'agit de l'application Linux nommée Perl Web Scraping Project dont la dernière version peut être téléchargée sous le nom 01WebScrapingV00.zip. Il peut être exécuté en ligne sur le fournisseur d'hébergement gratuit OnWorks pour les postes de travail.
Téléchargez et exécutez en ligne cette application nommée Perl Web Scraping Project avec OnWorks gratuitement.
Suivez ces instructions pour exécuter cette application :
- 1. Téléchargé cette application sur votre PC.
- 2. Entrez dans notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous voulez.
- 3. Téléchargez cette application dans ce gestionnaire de fichiers.
- 4. Démarrez l'émulateur en ligne OnWorks Linux ou Windows en ligne ou l'émulateur en ligne MACOS à partir de ce site Web.
- 5. Depuis le système d'exploitation OnWorks Linux que vous venez de démarrer, accédez à notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous souhaitez.
- 6. Téléchargez l'application, installez-la et exécutez-la.
CAPTURES D'ÉCRAN
Ad
Projet de grattage Web Perl
DESCRIPTION
Le grattage Web (récolte Web ou extraction de données Web) est un grattage de données utilisé pour extraire des données de sites Web.[1] Les logiciels de grattage Web peuvent accéder au World Wide Web directement à l'aide du protocole de transfert hypertexte ou via un navigateur Web. Alors que le grattage Web peut être effectué manuellement par un utilisateur de logiciel, le terme fait généralement référence à des processus automatisés mis en œuvre à l'aide d'un robot ou d'un robot d'exploration Web. Il s'agit d'une forme de copie, dans laquelle des données spécifiques sont collectées et copiées à partir du Web, généralement dans une base de données ou une feuille de calcul locale centrale, pour une récupération ou une analyse ultérieure.
Le grattage Web d'une page Web consiste à la récupérer et à en extraire.[1][2] La récupération est le téléchargement d'une page (ce que fait un navigateur lorsque vous affichez la page). Par conséquent, l'exploration Web est un composant principal du grattage Web, pour récupérer des pages pour un traitement ultérieur. Une fois récupéré, l'extraction peut avoir lieu. Le contenu d'une page peut être analysé, recherché, reformaté, ses données copiées dans une feuille de calcul, etc.
Interface utilisateur
Tk
Langage de programmation
Perl
Il s'agit d'une application qui peut également être récupérée à partir de https://sourceforge.net/projects/perl-web-scraping-project/. Il a été hébergé dans OnWorks afin d'être exécuté en ligne de la manière la plus simple à partir de l'un de nos systèmes d'exploitation gratuits.