これはPearlという名前のLinuxアプリで、最新リリースはPearlsourcecode.zipとしてダウンロードできます。ワークステーション向けの無料ホスティングプロバイダーであるOnWorksでオンラインで実行できます。
OnWorks で Pearl というアプリを無料でダウンロードしてオンラインで実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
スクリーンショットは
Ad
パール
DESCRIPTION
Pearl は、実世界のシーケンシャルな意思決定のために構築された、本番環境対応の強化学習およびコンテキストバンディットエージェントライブラリです。ポリシー学習器、リプレイバッファ、探索戦略、安全モジュール、履歴サマライザといったモジュールコンポーネントを中心に構成されており、これらを組み合わせることで、明確な境界と強力なデフォルトを持つ信頼性の高いエージェントを形成できます。このライブラリは、コンテキストバンディット(LinUCB、LinTS、SquareCB、ニューラルバンディットなど)と完全シーケンシャル RL(DQN、PPO スタイルのポリシー最適化など)の 2 つの領域にわたって、古典的アルゴリズムと現代的なアルゴリズムを実装し、非定常性や動的アクション空間などの実用的な問題にも配慮しています。チュートリアルでは、表形式のデータセットから得られた OpenAI Gym タスクとコンテキストバンディット設定のエンドツーエンドのワークフローを示し、再現性と明確なベースラインを重視しています。Pearl の設計は明瞭性と展開可能性を重視しており、メトリクス、ログ記録、評価ハーネスが統合されているため、学習の監視、エージェントの比較、回帰の検出が可能です。
オプション
- ポリシー学習、探索、安全性、リプレイ バッファを備えたモジュール型エージェント スタック
- コンテキストバンディットとシーケンシャルRLを1つのコードベースで網羅するアルゴリズム
- 非定常設定と動的行動空間のサポート
- 実際のデータセットを使用したジムタスクとバンディット問題のわかりやすいチュートリアル
- 組み込みの評価、ログ記録、ベンチマークユーティリティ
- 生産準備と再現性を目的とした実用的なデフォルト
プログラミング言語
Python
カテゴリー
このアプリケーションは、https://sourceforge.net/projects/pearl.mirror/ からも入手できます。OnWorks でホストされているため、無料のオペレーティングシステムから最も簡単にオンラインで実行できます。