Đây là ứng dụng Linux có tên MADDPG, phiên bản mới nhất có thể tải xuống tại maddpgsourcecode.tar.gz. Ứng dụng có thể chạy trực tuyến trên nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks dành cho máy trạm.
Tải xuống và chạy trực tuyến ứng dụng có tên MADDPG với OnWorks miễn phí.
Làm theo các hướng dẫn sau để chạy ứng dụng này:
- 1. Đã tải ứng dụng này xuống PC của bạn.
- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.
- 4. Khởi động trình giả lập trực tuyến OnWorks Linux hoặc trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MACOS từ trang web này.
- 5. Từ Hệ điều hành OnWorks Linux mà bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 6. Tải xuống ứng dụng, cài đặt và chạy nó.
MADDPG
Ad
MÔ TẢ
MADDPG (Multi-Agent Deep Deterministic Policy Gradient) là bản phát hành mã chính thức từ bài báo của OpenAI có tên Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments. Kho lưu trữ này triển khai một thuật toán học tăng cường đa tác nhân, mở rộng DDPG sang các tình huống mà nhiều tác nhân tương tác trong môi trường dùng chung. Mỗi tác nhân có chính sách riêng, nhưng quá trình đào tạo sử dụng các nhà phê bình tập trung dựa trên các quan sát và hành động của tất cả các tác nhân, cho phép học trong các môi trường hợp tác, cạnh tranh và hỗn hợp. Mã được xây dựng trên TensorFlow và tích hợp với Multi-Agent Particle Environments (MPE) để đánh giá chuẩn. Các nhà nghiên cứu có thể sử dụng nó để tái tạo các thí nghiệm được trình bày trong bài báo, minh họa cách các tác nhân học các hành vi như phối hợp, cạnh tranh và giao tiếp. Mặc dù đã được lưu trữ, MADDPG vẫn là một cơ sở được trích dẫn rộng rãi trong nghiên cứu học tăng cường đa tác nhân và đã truyền cảm hứng cho các phát triển thuật toán tiếp theo.
Tính năng
- Triển khai DDPG đa tác nhân với các nhà phê bình tập trung
- Hỗ trợ các thiết lập hợp tác, cạnh tranh và tác nhân hỗn hợp
- Đường ống đào tạo dựa trên TensorFlow cho RL đa tác nhân
- Tương thích với Môi trường hạt đa tác nhân (MPE)
- Các tập lệnh để tái tạo kết quả từ bài báo gốc
- Tham khảo triển khai cho nghiên cứu trong RL đa tác nhân
Ngôn ngữ lập trình
Python
Danh Mục
Đây là một ứng dụng cũng có thể được tải xuống từ https://sourceforge.net/projects/maddpg.mirror/. Ứng dụng này được lưu trữ trên OnWorks để có thể chạy trực tuyến dễ dàng nhất từ một trong những Hệ điều hành miễn phí của chúng tôi.