AWS SDK for Pandas라는 이름의 Linux 앱으로, 최신 릴리스는 awswrangler-layer-3.13.0-py3.13-arm64.zip으로 다운로드할 수 있습니다. 워크스테이션용 무료 호스팅 제공업체인 OnWorks에서 온라인으로 실행할 수 있습니다.
OnWorks를 사용하여 AWS SDK for pandas라는 앱을 무료로 다운로드하여 온라인에서 실행해보세요.
이 앱을 실행하려면 다음 지침을 따르세요.
- 1. 이 애플리케이션을 PC에 다운로드했습니다.
- 2. 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX에 원하는 사용자 이름을 입력합니다.
- 3. 이러한 파일 관리자에서 이 응용 프로그램을 업로드합니다.
- 4. 이 웹사이트에서 OnWorks Linux 온라인 또는 Windows 온라인 에뮬레이터 또는 MACOS 온라인 에뮬레이터를 시작합니다.
- 5. 방금 시작한 OnWorks Linux OS에서 원하는 사용자 이름으로 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX로 이동합니다.
- 6. 응용 프로그램을 다운로드하여 설치하고 실행합니다.
스크린샷:
팬더용 AWS SDK
설명 :
aws-sdk-pandas(이전 명칭: AWS Data Wrangler)는 pandas와 AWS 분석 스택을 연결하여 DataFrames가 클라우드 서비스와 원활하게 주고받을 수 있도록 합니다. 몇 줄의 코드만으로 Parquet/CSV/JSON/ORC 형식의 Amazon S3에서 데이터를 읽고 쓰고, AWS Glue 데이터 카탈로그에 테이블을 등록하고, Amazon Athena를 통해 pandas에 직접 쿼리를 실행할 수 있습니다. 이 라이브러리는 파티셔닝, 압축, 벡터화된 I/O와 같은 효율적인 패턴을 추상화하여 보일러플레이트 코드를 직접 작성하지 않고도 고성능 데이터 레이크 운영을 구현할 수 있도록 합니다. 또한 Redshift, OpenSearch 및 기타 서비스를 지원하여 SQL 엔진과 Python 변환을 혼합한 ETL 작업을 지원합니다. 운영 도우미는 IAM, 세션 및 동시성을 처리하는 동시에 암호화, 버전 관리 및 카탈로그 일관성을 위한 기능을 제공합니다. 결과적으로 AWS 네이티브 스토리지 및 쿼리 엔진을 대규모로 활용하면서 Python으로 분석을 유지하는 생산적인 워크플로가 구현됩니다.
기능
- Parquet, CSV, JSON 및 ORC를 사용하여 S3에 대한 DataFrame의 고수준 읽기/쓰기
- 스키마 및 SQL 쿼리를 위한 AWS Glue Catalog 및 Athena와의 긴밀한 통합
- Redshift COPY/UNLOAD 및 데이터 마이그레이션 패턴에 대한 편의성 방법
- 파티션, 압축 및 열 형식 자동 처리
- 암호화 및 버전 관리 옵션이 있는 세션 및 IAM 도우미
- 대규모 데이터 레이크 워크로드에 최적화된 확장 가능한 I/O 경로
프로그래밍 언어
Python
카테고리
이 애플리케이션은 https://sourceforge.net/projects/aws-sdk-for-pandas.mirror/에서도 다운로드할 수 있습니다. OnWorks에 호스팅되어 무료 운영 체제 중 하나에서 가장 쉽게 온라인에서 실행할 수 있도록 설계되었습니다.