Dies ist die Linux-App namens Pearl, deren neueste Version als Pearlsourcecode.zip heruntergeladen werden kann. Sie kann online beim kostenlosen Hosting-Anbieter OnWorks für Workstations ausgeführt werden.
Laden Sie diese App namens Pearl mit OnWorks kostenlos herunter und führen Sie sie online aus.
Befolgen Sie diese Anweisungen, um diese App auszuführen:
- 1. Diese Anwendung auf Ihren PC heruntergeladen.
- 2. Geben Sie in unserem Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX den gewünschten Benutzernamen ein.
- 3. Laden Sie diese Anwendung in einem solchen Dateimanager hoch.
- 4. Starten Sie den OnWorks Linux-Online- oder Windows-Online-Emulator oder den MACOS-Online-Emulator von dieser Website.
- 5. Rufen Sie vom gerade gestarteten OnWorks Linux-Betriebssystem aus unseren Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX mit dem gewünschten Benutzernamen auf.
- 6. Laden Sie die Anwendung herunter, installieren Sie sie und führen Sie sie aus.
SCREENSHOTS
Ad
Pearl
BESCHREIBUNG
Pearl ist eine produktionsreife Bibliothek für Reinforcement Learning und Contextual Bandit-Agenten, die für sequenzielle Entscheidungsfindung in der realen Welt entwickelt wurde. Sie ist um modulare Komponenten herum organisiert – Policy Learner, Replay Buffer, Explorationsstrategien, Sicherheitsmodule und History Summierer – die sich zu zuverlässigen Agenten mit klaren Grenzen und starken Standardwerten zusammenfügen. Die Bibliothek implementiert klassische und moderne Algorithmen in zwei Regimen: Contextual Bandits (z. B. LinUCB, LinTS, SquareCB, neuronale Banditen) und vollständig sequenzielles RL (z. B. DQN, Policy-Optimierung im PPO-Stil), wobei praktische Aspekte wie Nichtstationarität und dynamische Aktionsräume berücksichtigt werden. Tutorials demonstrieren End-to-End-Workflows für OpenAI Gym-Aufgaben und Contextual Bandit-Setups, die aus tabellarischen Datensätzen abgeleitet wurden, und legen dabei Wert auf Reproduzierbarkeit und klare Baselines. Das Design von Pearl fördert Klarheit und Einsatzfähigkeit: Metriken, Protokollierung und Auswertungsfunktionen sind integriert, sodass Sie das Lernen überwachen, Agenten vergleichen und Regressionen erkennen können.
Eigenschaften
- Modularer Agentenstapel mit Policy-Learnern, Exploration, Sicherheit und Wiedergabepuffern
- Algorithmen, die Contextual Bandits und Sequential RL in einer Codebasis umfassen
- Unterstützung für nichtstationäre Umgebungen und dynamische Aktionsräume
- Klare Tutorials für Gym-Aufgaben und Banditenprobleme mit realen Datensätzen
- Integrierte Dienstprogramme für Auswertung, Protokollierung und Benchmarking
- Praxisnahe Vorgaben mit dem Ziel der Serienreife und Reproduzierbarkeit
Programmiersprache
Python
Kategorien
Diese Anwendung kann auch von https://sourceforge.net/projects/pearl.mirror/ heruntergeladen werden. Sie wurde in OnWorks gehostet, um sie auf einfachste Weise online von einem unserer kostenlosen Betriebssysteme aus ausführen zu können.
