Загрузка RLax для Linux

Это приложение для Linux под названием RLax, последнюю версию которого можно скачать как RLax0.1.8sourcecode.tar.gz. Его можно запустить онлайн на бесплатном хостинг-провайдере OnWorks для рабочих станций.

 
 

Бесплатно загрузите и запустите онлайн это приложение под названием RLax с OnWorks.

Следуйте этим инструкциям, чтобы запустить это приложение:

- 1. Загрузил это приложение на свой компьютер.

- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.

- 3. Загрузите это приложение в такой файловый менеджер.

- 4. Запустите онлайн-эмулятор OnWorks Linux или Windows или онлайн-эмулятор MACOS с этого веб-сайта.

- 5. В только что запущенной ОС OnWorks Linux перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.

- 6. Скачайте приложение, установите его и запустите.

СКРИНШОТЫ:


Рлакс


ОПИСАНИЕ:

RLax (произносится как «релакс») — это библиотека на основе JAX, разработанная Google DeepMind. Она предоставляет многократно используемые математические строительные блоки для построения агентов обучения с подкреплением (RL). Вместо реализации полных алгоритмов RLax фокусируется на основных функциональных операциях, лежащих в основе методов RL, таких как вычисление функций ценности, возвратов, градиентов политики и членов потерь, что позволяет исследователям гибко создавать собственные агенты. Она поддерживает как обучение по политике, так и вне ее, а также подходы, основанные на ценности, политике и модели. RLax полностью компилируется JIT с JAX, обеспечивая высокопроизводительное выполнение на CPU, GPU и TPU. Библиотека реализует инструменты для уравнений Беллмана, распределений возвратов, общих функций ценности и оптимизации политики как в непрерывных, так и в дискретных пространствах действий. Она легко интегрируется с Haiku DeepMind (для определения нейронных сетей) и Optax (для оптимизации), что делает её ключевым компонентом модульных конвейеров RL.



Особенности

  • Модульные примитивы обучения с подкреплением (значения, возвраты и политики)
  • Оптимизировано для JAX для ускорения GPU/TPU и автоматического дифференцирования
  • Поддерживает парадигмы обучения в рамках политики и вне ее
  • Реализует функции распределения значений и общие функции значений
  • Интегрируется с Haiku и Optax для нейронных сетей и конвейеров оптимизации
  • Комплексное тестирование и примеры для воспроизводимости и использования в образовательных целях


Язык программирования

Python, оболочка Unix


Категории

Библиотеки

Это приложение также можно скачать по адресу https://sourceforge.net/projects/rlax.mirror/. Оно размещено на OnWorks для максимально удобного запуска онлайн через одну из наших бесплатных операционных систем.



Новейшие онлайн-программы для Linux и Windows


Категории для загрузки Программное обеспечение и программы для Windows и Linux