Tải xuống RLax cho Linux

Đây là ứng dụng Linux có tên RLax, phiên bản mới nhất có thể tải xuống dưới dạng RLax0.1.8sourcecode.tar.gz. Ứng dụng có thể chạy trực tuyến trên nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks dành cho máy trạm.

 
 

Tải xuống và chạy trực tuyến ứng dụng có tên RLax với OnWorks miễn phí.

Làm theo các hướng dẫn sau để chạy ứng dụng này:

- 1. Đã tải ứng dụng này xuống PC của bạn.

- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.

- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.

- 4. Khởi động trình giả lập trực tuyến OnWorks Linux hoặc trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MACOS từ trang web này.

- 5. Từ Hệ điều hành OnWorks Linux mà bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.

- 6. Tải xuống ứng dụng, cài đặt và chạy nó.

MÀN HÌNH:


RLax


SỰ MIÊU TẢ:

RLax (phát âm là "relax") là một thư viện dựa trên JAX do Google DeepMind phát triển, cung cấp các khối xây dựng toán học có thể tái sử dụng để xây dựng các tác nhân học tăng cường (RL). Thay vì triển khai các thuật toán đầy đủ, RLax tập trung vào các hoạt động chức năng cốt lõi làm nền tảng cho các phương pháp RL—chẳng hạn như tính toán các hàm giá trị, trả về, độ dốc chính sách và các điều khoản mất mát—cho phép các nhà nghiên cứu linh hoạt lắp ráp các tác nhân của riêng họ. Nó hỗ trợ cả học tập theo chính sách và ngoài chính sách, cũng như các phương pháp tiếp cận dựa trên giá trị, dựa trên chính sách và dựa trên mô hình. RLax có thể biên dịch hoàn toàn JIT với JAX, cho phép thực thi hiệu suất cao trên các nền tảng CPU, GPU và TPU. Thư viện triển khai các công cụ cho các phương trình Bellman, phân phối trả về, hàm giá trị chung và tối ưu hóa chính sách trong cả không gian hành động liên tục và rời rạc. Nó tích hợp liền mạch với Haiku của DeepMind (để định nghĩa mạng nơ-ron) và Optax (để tối ưu hóa), khiến nó trở thành một thành phần quan trọng trong các đường ống RL mô-đun.



Tính năng

  • Các nguyên hàm học tăng cường mô-đun (giá trị, trả về và chính sách)
  • Được tối ưu hóa cho JAX để tăng tốc GPU/TPU và phân biệt tự động
  • Hỗ trợ các mô hình học tập có chính sách và ngoài chính sách
  • Thực hiện các hàm giá trị phân phối và các hàm giá trị tổng quát
  • Tích hợp với Haiku và Optax cho mạng lưới nơ-ron và các đường ống tối ưu hóa
  • Kiểm tra toàn diện và các ví dụ về khả năng tái tạo và sử dụng trong giáo dục


Ngôn ngữ lập trình

Python, Vỏ Unix


Danh Mục

Thư viện

Đây là một ứng dụng cũng có thể được tải xuống từ https://sourceforge.net/projects/rlax.mirror/. Ứng dụng này được lưu trữ trên OnWorks để có thể chạy trực tuyến dễ dàng nhất từ ​​một trong những Hệ điều hành miễn phí của chúng tôi.



Các chương trình trực tuyến Linux & Windows mới nhất


Danh mục tải xuống Phần mềm & Chương trình cho Windows & Linux