این یک برنامه لینوکسی به نام Scalable Distributed Deep-RL است که آخرین نسخه آن را میتوانید با نام scalable_agentsourcecode.tar.gz دانلود کنید. این برنامه را میتوان به صورت آنلاین در ارائه دهنده خدمات میزبانی رایگان OnWorks برای ایستگاههای کاری اجرا کرد.
این برنامه با نام Scalable Distributed Deep-RL with OnWorks را به صورت رایگان دانلود و اجرا کنید.
برای اجرای این برنامه این دستورالعمل ها را دنبال کنید:
- 1. این برنامه را در رایانه شخصی خود دانلود کنید.
- 2. در فایل منیجر ما https://www.onworks.net/myfiles.php?username=XXXXX نام کاربری مورد نظر خود را وارد کنید.
- 3. این برنامه را در چنین فایل منیجر آپلود کنید.
- 4. OnWorks Linux آنلاین یا شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MACOS را از این وب سایت راه اندازی کنید.
- 5. از سیستم عامل لینوکس OnWorks که به تازگی راه اندازی کرده اید، به مدیر فایل ما https://www.onworks.net/myfiles.php?username=XXXXX با نام کاربری که می خواهید بروید.
- 6. اپلیکیشن را دانلود کرده، نصب و اجرا کنید.
اسکرین شات ها:
یادگیری عمیق توزیعشدهی مقیاسپذیر
DESCRIPTION:
عامل مقیاسپذیر، پیادهسازی باز IMPALA (معماریهای بازیگر-یادگیرنده با وزن اهمیت)، یک چارچوب یادگیری تقویتی توزیعشده بسیار مقیاسپذیر است که توسط Google DeepMind توسعه داده شده است. IMPALA با جدا کردن فرآیندهای بازیگری و یادگیری، الگوی جدیدی را برای آموزش کارآمد عاملها در محیطهای بزرگ معرفی کرد. در این معماری، چندین فرآیند بازیگر به طور موازی با محیطهای خود تعامل میکنند تا مسیرها را جمعآوری کنند، که سپس به صورت غیرهمزمان برای بهروزرسانی سیاست به یک یادگیرنده متمرکز ارسال میشوند. یادگیرنده از وزندهی اهمیت برای اصلاح تأخیر سیاست بین بازیگران و یادگیرنده استفاده میکند و آموزش پایدار خارج از سیاست را در مقیاس بزرگ امکانپذیر میسازد. این طراحی به سیستم اجازه میدهد تا به طور کارآمد در صدها محیط و میلیاردها فریم مقیاسپذیر شود و در عین حال کارایی و پایداری نمونه را حفظ کند. این پیادهسازی از آموزش در آزمایشگاه DeepMind (DMLab) پشتیبانی میکند و همچنین برای محیطهای دیگری مانند Atari و Street View نیز سازگار شده است.
امکانات
- IMPALA، یک چارچوب یادگیری تقویتی عمیق توزیعشده و مقیاسپذیر را پیادهسازی میکند.
- از معماری ناهمزمانِ بازیگر-یادگیرنده با وزندهی اهمیت پشتیبانی میکند.
- آموزش کارآمد عاملها در محیطهای بزرگ (مثلاً DMLab-30، Atari)
- شامل دستهبندی پویا برای بهینهسازی توان عملیاتی دادهها
- سازگار با DeepMind Sonnet و TensorFlow
- تنظیمات Dockerfile را برای آموزش تک ماشینی یا توزیعشدهی قابل تکرار فراهم میکند.
زبان برنامه نویسی
سی پلاس پلاس، پایتون
دسته بندی ها
این برنامهای است که میتوان آن را از https://sourceforge.net/projects/scalable-dist-deep-rl.mirror/ نیز دریافت کرد. این برنامه در OnWorks میزبانی شده است تا بتوان آن را به سادهترین روش از یکی از سیستمهای عامل رایگان ما به صورت آنلاین اجرا کرد.