适用于 Linux 的 AWS SDK for pandas 下载

这是名为 AWS SDK for pandas 的 Linux 应用程序,其最新版本可从 awswrangler-layer-3.13.0-py3.13-arm64.zip 下载。它可以在免费托管服务提供商 OnWorks for 工作站上在线运行。

 
 

使用 OnWorks 免费下载并在线运行名为 AWS SDK for pandas 的应用程序。

请按照以下说明运行此应用程序:

- 1. 在您的 PC 中下载此应用程序。

- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。

- 3. 在这样的文件管理器中上传这个应用程序。

- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。

- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。

- 6. 下载应用程序,安装并运行。

截图:


适用于熊猫的 AWS 开发工具包


描述:

aws-sdk-pandas(原名 AWS Data Wrangler)将 pandas 与 AWS 分析堆栈连接起来,使 DataFrame 能够在云服务之间无缝流动。只需几行代码,即可从 Amazon S3 读取和写入 Parquet/CSV/JSON/ORC 格式的数据,在 AWS Glue 数据目录中注册表,并直接使用 Amazon Athena 查询 pandas 数据。该库抽象了分区、压缩和向量化 I/O 等高效模式,让您无需编写大量样板代码即可实现高性能的数据湖操作。它还支持 Redshift、OpenSearch 和其他服务,支持将 SQL 引擎和 Python 转换相结合的 ETL 任务。操作辅助函数可处理 IAM、会话和并发,同时提供加密、版本控制和目录一致性等选项。最终,您将获得一个高效的工作流程,在 Python 中完成分析的同时,还能大规模地利用 AWS 原生存储和查询引擎。



功能

  • 使用 Parquet、CSV、JSON 和 ORC 对 S3 进行 DataFrame 的高级读写操作
  • 与 AWS Glue Catalog 和 Athena 紧密集成,用于架构和 SQL 查询
  • Redshift COPY/UNLOAD 和数据迁移模式的便捷方法
  • 自动处理分区、压缩和列式格式
  • 会话和 IAM 助手,提供加密和版本控制选项
  • 针对大型数据湖工作负载优化的可扩展 I/O 路径


程式语言

Python


分类

数据科学

该应用程序也可以从 https://sourceforge.net/projects/aws-sdk-for-pandas.mirror/ 获取。它托管在 OnWorks 上,以便可以通过我们的免费操作系统之一以最简单的方式在线运行。



最新的 Linux 和 Windows 在线程序


下载适用于 Windows 和 Linux 的软件和程序的类别