Це Linux-додаток під назвою Pearl, останню версію якого можна завантажити як Pearlsourcecode.zip. Його можна запускати онлайн на безкоштовному хостинг-провайдері OnWorks для робочих станцій.
Завантажте та запустіть онлайн цю програму під назвою Pearl з OnWorks безкоштовно.
Дотримуйтесь цих інструкцій, щоб запустити цю програму:
- 1. Завантажив цю програму на свій ПК.
- 2. Введіть у наш файловий менеджер https://www.onworks.net/myfiles.php?username=XXXXX із потрібним ім'ям користувача.
- 3. Завантажте цю програму в такий файловий менеджер.
- 4. Запустіть онлайн-емулятор OnWorks Linux або Windows або онлайн-емулятор MACOS з цього веб-сайту.
- 5. З ОС OnWorks Linux, яку ви щойно запустили, перейдіть до нашого файлового менеджера https://www.onworks.net/myfiles.php?username=XXXXX з потрібним іменем користувача.
- 6. Завантажте програму, встановіть її та запустіть.
СКРЕНИ:
перловий
ОПИС:
Pearl — це готова до використання бібліотека агентів-бандитів, що навчаються з підкріпленням та створена для послідовного прийняття рішень у реальному світі. Вона організована навколо модульних компонентів — навчальних програм політик, буферів відтворення, стратегій дослідження, модулів безпеки та підсумовувачів історії — які поєднуються, утворюючи надійних агентів з чіткими межами та строгими значеннями за замовчуванням. Бібліотека реалізує класичні та сучасні алгоритми у двох режимах: контекстні бандити (наприклад, LinUCB, LinTS, SquareCB, нейронні бандити) та повністю послідовне RL (наприклад, DQN, оптимізація політик у стилі PPO), з увагою до практичних питань, таких як нестаціонарність та динамічні простори дій. Навчальні посібники демонструють комплексні робочі процеси для завдань OpenAI Gym та налаштувань контекстних бандитів, отриманих з табличних наборів даних, з акцентом на відтворюваності та чітких базових рівнях. Дизайн Pearl сприяє ясності та розгортанню: інтегровані інструменти метрик, реєстрації та оцінки, щоб ви могли контролювати навчання, порівнювати агентів та виявляти регресії.
Функції
- Модульний стек агентів з буферами навчання політик, дослідження, безпеки та відтворення
- Алгоритми, що охоплюють контекстуальні бандити та послідовне RL в одній кодовій базі
- Підтримка нестаціонарних налаштувань та динамічних просторів дій
- Зрозумілі навчальні посібники для завдань у спортзалі та задач з бандитами з використанням реальних наборів даних
- Вбудовані утиліти для оцінки, ведення журналу та порівняльного аналізу
- Практичні налаштування за замовчуванням, спрямовані на готовність до виробництва та відтворюваність
Мова програмування
Python
Категорії
Цю програму також можна завантажити з https://sourceforge.net/projects/pearl.mirror/. Вона розміщена на OnWorks для найпростішого запуску онлайн з однієї з наших безкоштовних операційних систем.