این یک برنامه لینوکس به نام RLax است که آخرین نسخه آن را میتوانید با عنوان RLax0.1.8sourcecode.tar.gz دانلود کنید. این برنامه را میتوان به صورت آنلاین در ارائه دهنده خدمات میزبانی رایگان OnWorks برای ایستگاههای کاری اجرا کرد.
این برنامه با نام RLax with OnWorks را به صورت رایگان دانلود و اجرا کنید.
برای اجرای این برنامه این دستورالعمل ها را دنبال کنید:
- 1. این برنامه را در رایانه شخصی خود دانلود کنید.
- 2. در فایل منیجر ما https://www.onworks.net/myfiles.php?username=XXXXX نام کاربری مورد نظر خود را وارد کنید.
- 3. این برنامه را در چنین فایل منیجر آپلود کنید.
- 4. OnWorks Linux آنلاین یا شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MACOS را از این وب سایت راه اندازی کنید.
- 5. از سیستم عامل لینوکس OnWorks که به تازگی راه اندازی کرده اید، به مدیر فایل ما https://www.onworks.net/myfiles.php?username=XXXXX با نام کاربری که می خواهید بروید.
- 6. اپلیکیشن را دانلود کرده، نصب و اجرا کنید.
اسکرین شات ها:
RLax
DESCRIPTION:
RLax (که به صورت «ریلکس» تلفظ میشود) یک کتابخانه مبتنی بر JAX است که توسط Google DeepMind توسعه داده شده است و بلوکهای سازنده ریاضی قابل استفاده مجدد را برای ساخت عاملهای یادگیری تقویتی (RL) فراهم میکند. RLax به جای پیادهسازی الگوریتمهای کامل، بر عملیات عملکردی اصلی که زیربنای روشهای RL هستند - مانند محاسبه توابع ارزش، بازدهها، گرادیانهای سیاست و عبارات زیان - تمرکز میکند و به محققان اجازه میدهد تا عاملهای خود را به صورت انعطافپذیر مونتاژ کنند. این کتابخانه از یادگیری درون سیاستی و برون سیاستی و همچنین رویکردهای مبتنی بر ارزش، مبتنی بر سیاست و مبتنی بر مدل پشتیبانی میکند. RLax کاملاً با JAX قابل کامپایل JIT است و امکان اجرای با کارایی بالا را در سراسر CPU، GPU و TPU backend فراهم میکند. این کتابخانه ابزارهایی را برای معادلات Bellman، توزیعهای بازده، توابع ارزش عمومی و بهینهسازی سیاست در هر دو فضای عمل پیوسته و گسسته پیادهسازی میکند. این کتابخانه به طور یکپارچه با Haiku (برای تعریف شبکه عصبی) و Optax (برای بهینهسازی) DeepMind ادغام میشود و آن را به یک جزء کلیدی در خطوط لوله RL ماژولار تبدیل میکند.
امکانات
- اصول اولیه یادگیری تقویتی ماژولار (مقادیر، بازدهها و سیاستها)
- بهینهسازی شده توسط JAX برای شتابدهی GPU/TPU و تمایز خودکار
- از الگوهای یادگیری درون-سیاستی و برون-سیاستی پشتیبانی میکند
- توابع مقدار توزیعی و توابع مقدار عمومی را پیادهسازی میکند
- برای شبکههای عصبی و خطوط لوله بهینهسازی با Haiku و Optax ادغام میشود.
- آزمایشها و مثالهای جامع برای تکرارپذیری و استفاده آموزشی
زبان برنامه نویسی
پایتون، یونیکس شل
دسته بندی ها
این برنامهای است که میتوان آن را از https://sourceforge.net/projects/rlax.mirror/ نیز دریافت کرد. این برنامه در OnWorks میزبانی شده است تا بتوان آن را به سادهترین روش به صورت آنلاین از یکی از سیستمهای عامل رایگان ما اجرا کرد.