این یک برنامه لینوکس به نام AWS SDK برای پانداس است که آخرین نسخه آن را میتوانید با عنوان awswrangler-layer-3.13.0-py3.13-arm64.zip دانلود کنید. این برنامه را میتوان به صورت آنلاین در ارائه دهنده هاست رایگان OnWorks برای ایستگاههای کاری اجرا کرد.
این برنامه با نام AWS SDK for pandas with OnWorks را به صورت رایگان دانلود و اجرا کنید.
برای اجرای این برنامه این دستورالعمل ها را دنبال کنید:
- 1. این برنامه را در رایانه شخصی خود دانلود کنید.
- 2. در فایل منیجر ما https://www.onworks.net/myfiles.php?username=XXXXX نام کاربری مورد نظر خود را وارد کنید.
- 3. این برنامه را در چنین فایل منیجر آپلود کنید.
- 4. OnWorks Linux آنلاین یا شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MACOS را از این وب سایت راه اندازی کنید.
- 5. از سیستم عامل لینوکس OnWorks که به تازگی راه اندازی کرده اید، به مدیر فایل ما https://www.onworks.net/myfiles.php?username=XXXXX با نام کاربری که می خواهید بروید.
- 6. اپلیکیشن را دانلود کرده، نصب و اجرا کنید.
اسکرین شات ها:
AWS SDK برای پانداها
DESCRIPTION:
aws-sdk-pandas (که قبلاً AWS Data Wrangler نام داشت) پانداس را به پشته تحلیلی AWS متصل میکند تا DataFrames به طور یکپارچه به سرویسهای ابری و از آنها جریان یابد. با چند خط کد، میتوانید از Amazon S3 در Parquet/CSV/JSON/ORC بخوانید و در آن بنویسید، جداول را در AWS Glue Data Catalog ثبت کنید و مستقیماً با Amazon Athena در پانداس پرسوجو کنید. این کتابخانه الگوهای کارآمدی مانند پارتیشنبندی، فشردهسازی و ورودی/خروجی برداری شده را خلاصه میکند، بنابراین میتوانید عملیات دریاچه داده کارآمدی را بدون استفاده از کدهای تکراری دستی دریافت کنید. همچنین از Redshift، OpenSearch و سایر سرویسها پشتیبانی میکند و وظایف ETL را که موتورهای SQL و تبدیلهای پایتون را ترکیب میکنند، فعال میکند. کمککنندههای عملیاتی، IAM، جلسات و همزمانی را مدیریت میکنند و در عین حال دستگیرههایی را برای رمزگذاری، نسخهبندی و سازگاری کاتالوگ در اختیار قرار میدهند. نتیجه، یک گردش کار مولد است که تجزیه و تحلیل شما را در پایتون نگه میدارد و در عین حال از موتورهای ذخیرهسازی و پرسوجوی بومی AWS در مقیاس بزرگ استفاده میکند.
امکانات
- خواندن/نوشتن سطح بالای DataFrames به S3 با Parquet، CSV، JSON و ORC
- ادغام کامل با کاتالوگ چسب AWS و آتنا برای طرحوارهها و کوئریهای SQL
- روشهای راحت برای کپی/بارگیری Redshift و الگوهای مهاجرت دادهها
- مدیریت خودکار پارتیشنها، فشردهسازی و قالببندیهای ستونی
- کمککنندههای Session و IAM با گزینههایی برای رمزگذاری و نسخهبندی
- مسیرهای ورودی/خروجی مقیاسپذیر، بهینه شده برای حجم کاری دریاچه داده بزرگ
زبان برنامه نویسی
پــایتــون
دسته بندی ها
این برنامهای است که میتوان آن را از آدرس https://sourceforge.net/projects/aws-sdk-for-pandas.mirror/ نیز دریافت کرد. این برنامه در OnWorks میزبانی شده است تا بتوان آن را به سادهترین روش به صورت آنلاین از یکی از سیستمهای عامل رایگان ما اجرا کرد.