这是名为 Pearl 的 Linux 应用程序,其最新版本可以下载为 Pearlsourcecode.zip。它可以在免费的工作站托管服务提供商 OnWorks 上在线运行。
使用 OnWorks 免费下载并在线运行这个名为 Pearl 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
SCREENSHOTS
Ad
珍珠
商品描述
Pearl 是一个可立即投入生产的强化学习和上下文老虎机 (contextual bandit) 代理库,专为现实世界的序列决策而构建。它由模块化组件(策略学习器、重放缓冲区、探索策略、安全模块和历史摘要器)组成,这些组件组合在一起,形成具有清晰边界和强大默认值的可靠代理。该库实现了两种机制的经典和现代算法:上下文老虎机(例如 LinUCB、LinTS、SquareCB、神经老虎机)和完全序列强化学习(例如 DQN、PPO 式策略优化),并关注非平稳性和动态动作空间等实际问题。教程演示了 OpenAI Gym 任务的端到端工作流程以及基于表格数据集的上下文老虎机设置,强调可重复性和清晰的基线。Pearl 的设计注重清晰度和可部署性:集成了指标、日志记录和评估工具,以便您可以监控学习情况、比较代理并捕捉回归。
功能
- 具有策略学习器、探索器、安全性和重放缓冲区的模块化代理堆栈
- 在一个代码库中涵盖上下文老虎机和顺序强化学习的算法
- 支持非平稳设置和动态动作空间
- 使用真实数据集的 Gym 任务和老虎机问题的清晰教程
- 内置评估、记录和基准测试实用程序
- 旨在实现生产准备和可重复性的实用默认值
程式语言
Python
分类
此应用程序也可从 https://sourceforge.net/projects/pearl.mirror/ 获取。它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最便捷的方式在线运行。