Il s'agit de l'application Linux Pearl, dont la dernière version est téléchargeable sous le nom Pearlsourcecode.zip. Elle peut être exécutée en ligne sur l'hébergeur gratuit OnWorks pour postes de travail.
Téléchargez et exécutez en ligne cette application nommée Pearl avec OnWorks gratuitement.
Suivez ces instructions pour exécuter cette application :
- 1. Téléchargé cette application sur votre PC.
- 2. Entrez dans notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous voulez.
- 3. Téléchargez cette application dans ce gestionnaire de fichiers.
- 4. Démarrez l'émulateur en ligne OnWorks Linux ou Windows en ligne ou l'émulateur en ligne MACOS à partir de ce site Web.
- 5. Depuis le système d'exploitation OnWorks Linux que vous venez de démarrer, accédez à notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous souhaitez.
- 6. Téléchargez l'application, installez-la et exécutez-la.
CAPTURES D'ÉCRAN:
Perle
DESCRIPTION:
Pearl est une bibliothèque d'agents d'apprentissage par renforcement et de bandits contextuels prête pour la production, conçue pour la prise de décision séquentielle en situation réelle. Elle s'articule autour de composants modulaires (apprenants de politiques, tampons de relecture, stratégies d'exploration, modules de sécurité et synthétiseurs d'historique) qui s'assemblent pour former des agents fiables aux limites claires et aux valeurs par défaut robustes. La bibliothèque implémente des algorithmes classiques et modernes dans deux régimes : les bandits contextuels (par exemple, LinUCB, LinTS, SquareCB, les bandits neuronaux) et l'apprentissage par renforcement entièrement séquentiel (par exemple, DQN, optimisation des politiques de type PPO), en tenant compte des aspects pratiques tels que la non-stationnarité et les espaces d'action dynamiques. Des tutoriels présentent des workflows complets sur les tâches OpenAI Gym et les configurations de bandits contextuels dérivées de jeux de données tabulaires, en mettant l'accent sur la reproductibilité et des bases de référence claires. La conception de Pearl privilégie la clarté et la déployabilité : les métriques, la journalisation et les outils d'évaluation sont intégrés pour vous permettre de surveiller l'apprentissage, de comparer les agents et de détecter les régressions.
Comment ça marche
- Pile d'agents modulaire avec apprenants de politique, exploration, sécurité et tampons de relecture
- Algorithmes couvrant les bandits contextuels et le RL séquentiel dans une seule base de code
- Prise en charge des paramètres non stationnaires et des espaces d'action dynamiques
- Tutoriels clairs pour les tâches de gym et les problèmes de bandit utilisant des ensembles de données réels
- Utilitaires d'évaluation, de journalisation et d'analyse comparative intégrés
- Valeurs par défaut pratiques visant à la préparation à la production et à la reproductibilité
Langage de programmation
Python
Catégories
Cette application peut également être téléchargée depuis https://sourceforge.net/projects/pearl.mirror/. Elle est hébergée sur OnWorks afin de pouvoir être exécutée en ligne plus facilement depuis l'un de nos systèmes d'exploitation gratuits.