این یک برنامه لینوکس به نام verl است که آخرین نسخه آن را میتوانید با نام v0.6.1sourcecode.tar.gz دانلود کنید. میتوانید آن را به صورت آنلاین در ارائه دهنده هاست رایگان OnWorks برای ایستگاههای کاری اجرا کنید.
این برنامه با نام verl with OnWorks را به صورت رایگان دانلود و آنلاین اجرا کنید.
برای اجرای این برنامه این دستورالعمل ها را دنبال کنید:
- 1. این برنامه را در رایانه شخصی خود دانلود کنید.
- 2. در فایل منیجر ما https://www.onworks.net/myfiles.php?username=XXXXX نام کاربری مورد نظر خود را وارد کنید.
- 3. این برنامه را در چنین فایل منیجر آپلود کنید.
- 4. OnWorks Linux آنلاین یا شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MACOS را از این وب سایت راه اندازی کنید.
- 5. از سیستم عامل لینوکس OnWorks که به تازگی راه اندازی کرده اید، به مدیر فایل ما https://www.onworks.net/myfiles.php?username=XXXXX با نام کاربری که می خواهید بروید.
- 6. اپلیکیشن را دانلود کرده، نصب و اجرا کنید.
اسکرین شات ها:
گمشده
DESCRIPTION:
VERL یک جعبه ابزار مبتنی بر یادگیری تقویتی است که برای آموزش و همسوسازی سیستمهای هوش مصنوعی مدرن، از مدلهای زبانی گرفته تا عاملهای تصمیمگیری، طراحی شده است. این جعبه ابزار، تنظیم دقیق تحت نظارت، مدلسازی ترجیحات و یادگیری تقویتی آنلاین را در یک پشته آموزشی منسجم گرد هم میآورد تا تیمها بتوانند با حداقل کد چسبنده، از دادههای خام به سیاستهای همسوسازی شده حرکت کنند. این کتابخانه بر مقیاسپذیری و کارایی تمرکز دارد و حلقههای آموزشی توزیعشده، دقت ترکیبی و ابزارهای بازپخش/بافر را ارائه میدهد که شتابدهندهها را مشغول نگه میدارد. این کتابخانه با پیادهسازیهای مرجع الگوریتمهای همسوسازی محبوب و مثالهای واضح ارائه میشود که بازتولید خطوط پایه را قبل از سفارشیسازی ساده میکند. خطوط داده، بازخورد انسانی، محیطهای شبیهسازی شده و ترجیحات مصنوعی را به عنوان منابع قابل تعویض در نظر میگیرند که به آزمایش سریع کمک میکند. VERL برای سختسازی تحقیق و تولید در نظر گرفته شده است: مجموعههای ثبت وقایع، بررسی و ارزیابی در آن تعبیه شدهاند تا بتوانید پویاییهای یادگیری و رگرسیونها را در طول زمان پیگیری کنید.
امکانات
- خط لوله یکپارچه برای SFT، مدلسازی ترجیحی و RL آنلاین
- آموزش توزیعشده با دقت ترکیبی و بافرهای بازپخش کارآمد
- پیادهسازیهای مرجع الگوریتمهای همترازی/RL محبوب
- منابع داده قابل اتصال برای بازخورد انسانی، شبیهسازی شده و مصنوعی
- داشبوردهای جامع ثبت وقایع، نقاط بازرسی و ارزیابی
- اجزای قابل توسعه برای پاداشها، سیاستها و محیطهای سفارشی
زبان برنامه نویسی
پــایتــون
دسته بندی ها
این برنامهای است که میتوان آن را از https://sourceforge.net/projects/verl.mirror/ نیز دریافت کرد. این برنامه در OnWorks میزبانی شده است تا بتوان آن را به سادهترین روش از یکی از سیستمهای عامل رایگان ما به صورت آنلاین اجرا کرد.