Это приложение для Linux под названием RLax, последнюю версию которого можно скачать как RLax0.1.8sourcecode.tar.gz. Его можно запустить онлайн на бесплатном хостинг-провайдере OnWorks для рабочих станций.
Бесплатно загрузите и запустите онлайн это приложение под названием RLax с OnWorks.
Следуйте этим инструкциям, чтобы запустить это приложение:
- 1. Загрузил это приложение на свой компьютер.
- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 3. Загрузите это приложение в такой файловый менеджер.
- 4. Запустите онлайн-эмулятор OnWorks Linux или Windows или онлайн-эмулятор MACOS с этого веб-сайта.
- 5. В только что запущенной ОС OnWorks Linux перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 6. Скачайте приложение, установите его и запустите.
СКРИНШОТЫ:
Рлакс
ОПИСАНИЕ:
RLax (произносится как «релакс») — это библиотека на основе JAX, разработанная Google DeepMind. Она предоставляет многократно используемые математические строительные блоки для построения агентов обучения с подкреплением (RL). Вместо реализации полных алгоритмов RLax фокусируется на основных функциональных операциях, лежащих в основе методов RL, таких как вычисление функций ценности, возвратов, градиентов политики и членов потерь, что позволяет исследователям гибко создавать собственные агенты. Она поддерживает как обучение по политике, так и вне ее, а также подходы, основанные на ценности, политике и модели. RLax полностью компилируется JIT с JAX, обеспечивая высокопроизводительное выполнение на CPU, GPU и TPU. Библиотека реализует инструменты для уравнений Беллмана, распределений возвратов, общих функций ценности и оптимизации политики как в непрерывных, так и в дискретных пространствах действий. Она легко интегрируется с Haiku DeepMind (для определения нейронных сетей) и Optax (для оптимизации), что делает её ключевым компонентом модульных конвейеров RL.
Особенности
- Модульные примитивы обучения с подкреплением (значения, возвраты и политики)
- Оптимизировано для JAX для ускорения GPU/TPU и автоматического дифференцирования
- Поддерживает парадигмы обучения в рамках политики и вне ее
- Реализует функции распределения значений и общие функции значений
- Интегрируется с Haiku и Optax для нейронных сетей и конвейеров оптимизации
- Комплексное тестирование и примеры для воспроизводимости и использования в образовательных целях
Язык программирования
Python, оболочка Unix
Категории
Это приложение также можно скачать по адресу https://sourceforge.net/projects/rlax.mirror/. Оно размещено на OnWorks для максимально удобного запуска онлайн через одну из наших бесплатных операционных систем.