Esta es la aplicación para Linux llamada Pearl, cuya última versión se puede descargar como Pearlsourcecode.zip. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.
Descargue y ejecute en línea esta aplicación llamada Pearl con OnWorks de forma gratuita.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie el emulador en línea OnWorks Linux o Windows en línea o el emulador en línea MACOS desde este sitio web.
- 5. Desde el SO OnWorks Linux que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación, instálala y ejecútala.
CAPTURAS DE PANTALLA:
Perla
DESCRIPCIÓN:
Pearl es una biblioteca de agentes de aprendizaje de refuerzo y bandidos contextuales lista para producción, diseñada para la toma de decisiones secuencial en el mundo real. Está organizada en torno a componentes modulares (aprendices de políticas, búferes de reproducción, estrategias de exploración, módulos de seguridad y resúmenes de historial) que se unen para formar agentes confiables con límites claros y valores predeterminados sólidos. La biblioteca implementa algoritmos clásicos y modernos en dos regímenes: bandidos contextuales (p. ej., LinUCB, LinTS, SquareCB, bandidos neuronales) y aprendizaje automático completamente secuencial (p. ej., DQN, optimización de políticas de estilo PPO), con atención a preocupaciones prácticas como la no estacionariedad y los espacios de acción dinámicos. Los tutoriales demuestran flujos de trabajo de extremo a extremo en tareas de OpenAI Gym y configuraciones de bandidos contextuales derivadas de conjuntos de datos tabulares, enfatizando la reproducibilidad y líneas base claras. El diseño de Pearl favorece la claridad y la capacidad de implementación: las métricas, el registro y los arneses de evaluación están integrados para que pueda monitorear el aprendizaje, comparar agentes y detectar regresiones.
Caracteristicas
- Pila de agentes modulares con aprendices de políticas, exploración, seguridad y buffers de reproducción
- Algoritmos que abarcan bandidos contextuales y RL secuencial en una base de código
- Soporte para configuraciones no estacionarias y espacios de acción dinámicos
- Tutoriales claros para tareas de gimnasio y problemas con bandidos usando conjuntos de datos reales
- Utilidades integradas de evaluación, registro y evaluación comparativa
- Valores predeterminados prácticos orientados a la preparación para la producción y la reproducibilidad
Lenguaje de programación
Python
Categorías
Esta aplicación también se puede descargar desde https://sourceforge.net/projects/pearl.mirror/. Está alojada en OnWorks para facilitar su ejecución en línea desde uno de nuestros sistemas operativos gratuitos.