Il s'agit de l'application Linux nommée AWS SDK pour pandas, dont la dernière version peut être téléchargée sous le nom awswrangler-layer-3.13.0-py3.13-arm64.zip. Elle peut être exécutée en ligne sur la plateforme d'hébergement gratuite OnWorks pour postes de travail.
Téléchargez et exécutez gratuitement en ligne cette application nommée AWS SDK pour pandas avec OnWorks.
Suivez ces instructions pour exécuter cette application :
- 1. Téléchargé cette application sur votre PC.
- 2. Entrez dans notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous voulez.
- 3. Téléchargez cette application dans ce gestionnaire de fichiers.
- 4. Démarrez l'émulateur en ligne OnWorks Linux ou Windows en ligne ou l'émulateur en ligne MACOS à partir de ce site Web.
- 5. Depuis le système d'exploitation OnWorks Linux que vous venez de démarrer, accédez à notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous souhaitez.
- 6. Téléchargez l'application, installez-la et exécutez-la.
CAPTURES D'ÉCRAN:
SDK AWS pour les pandas
DESCRIPTION:
Le SDK aws-sdk-pandas (anciennement AWS Data Wrangler) connecte pandas à la suite d'analyse AWS, permettant ainsi une circulation fluide des DataFrames entre les services cloud et le système. En quelques lignes de code, vous pouvez lire et écrire des données sur Amazon S3 aux formats Parquet, CSV, JSON et ORC, enregistrer des tables dans le catalogue de données AWS Glue et interroger directement pandas avec Amazon Athena. La bibliothèque simplifie les processus d'optimisation tels que le partitionnement, la compression et les E/S vectorisées, vous garantissant ainsi des opérations performantes sur votre lac de données sans avoir à développer de code répétitif. Elle prend également en charge Redshift, OpenSearch et d'autres services, permettant des tâches ETL combinant moteurs SQL et transformations Python. Des fonctions d'assistance opérationnelle gèrent IAM, les sessions et la concurrence, tout en offrant des options pour le chiffrement, le versionnage et la cohérence du catalogue. Il en résulte un flux de travail productif qui vous permet de conserver vos analyses en Python tout en exploitant à grande échelle le stockage natif d'AWS et ses moteurs de requêtes.
Fonctionnement
- Lecture/écriture de haut niveau de DataFrames sur S3 avec Parquet, CSV, JSON et ORC
- Intégration étroite avec AWS Glue Catalog et Athena pour les schémas et les requêtes SQL
- Méthodes pratiques pour les opérations de copie/déchargement Redshift et les modèles de migration de données
- Gestion automatique des partitions, de la compression et des formats colonnaires
- Assistants de session et IAM avec options de chiffrement et de versionnage
- Chemins d'E/S évolutifs optimisés pour les charges de travail importantes des lacs de données
Langage de programmation
Python
Catégories
Cette application est également disponible à l'adresse https://sourceforge.net/projects/aws-sdk-for-pandas.mirror/. Elle est hébergée sur OnWorks afin de pouvoir être exécutée en ligne facilement depuis l'un de nos systèmes d'exploitation gratuits.