This is the Windows app named RLax whose latest release can be downloaded as RLax0.1.8sourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
הורד והפעל אונליין את האפליקציה הזו בשם RLax עם OnWorks בחינם.
בצע את ההוראות הבאות כדי להפעיל את האפליקציה הזו:
- 1. הורד את היישום הזה למחשב שלך.
- 2. הזן במנהל הקבצים שלנו https://www.onworks.net/myfiles.php?username=XXXXX עם שם המשתמש שאתה רוצה.
- 3. העלה את היישום הזה במנהל קבצים כזה.
- 4. הפעל כל אמולטור מקוון של OS OnWorks מאתר זה, אך עדיף אמולטור מקוון של Windows.
- 5. ממערכת ההפעלה OnWorks Windows שזה עתה התחלת, עבור אל מנהל הקבצים שלנו https://www.onworks.net/myfiles.php?username=XXXXX עם שם המשתמש הרצוי.
- 6. הורד את האפליקציה והתקן אותה.
- 7. הורד את Wine ממאגרי התוכנה שלך להפצות לינוקס. לאחר ההתקנה, תוכל ללחוץ פעמיים על האפליקציה כדי להפעיל אותם עם Wine. אתה יכול גם לנסות את PlayOnLinux, ממשק מפואר מעל Wine שיעזור לך להתקין תוכניות ומשחקים פופולריים של Windows.
Wine היא דרך להפעיל תוכנת Windows על לינוקס, אך ללא צורך ב-Windows. Wine היא שכבת תאימות של Windows בקוד פתוח שיכולה להריץ תוכניות Windows ישירות על כל שולחן עבודה של לינוקס. בעיקרו של דבר, Wine מנסה להטמיע מחדש מספיק של Windows מאפס כדי שהוא יוכל להריץ את כל יישומי Windows מבלי להזדקק ל-Windows.
בצילומי מסך
Ad
RLax
תיאור
RLax (מבוטא "relax") היא ספרייה מבוססת JAX שפותחה על ידי גוגל DeepMind ומספקת אבני בניין מתמטיות לשימוש חוזר לבניית סוכני למידה מחוזקת (RL). במקום ליישם אלגוריתמים מלאים, RLax מתמקד בפעולות הפונקציונליות המרכזיות העומדות בבסיס שיטות RL - כגון חישוב פונקציות ערך, החזרות, גרדיאנטים של מדיניות ומונחי הפסד - המאפשרים לחוקרים להרכיב באופן גמיש את הסוכנים שלהם. היא תומכת הן בלמידה על-מדיניות והן בלמידה מחוץ למדיניות, כמו גם בגישות מבוססות ערך, מבוססות מדיניות ומודל. RLax ניתן להידור מלא של JIT עם JAX, מה שמאפשר ביצועים גבוהים על פני מערכות הפעלה אחוריות של CPU, GPU ו-TPU. הספרייה מיישמת כלים למשוואות Bellman, התפלגויות החזרה, פונקציות ערך כלליות ואופטימיזציה של מדיניות במרחבי פעולה רציפים ובדידים כאחד. היא משתלבת בצורה חלקה עם Haiku (להגדרת רשת נוירונים) ו-Optax (לאופטימיזציה) של DeepMind, מה שהופך אותה למרכיב מפתח בצינורות RL מודולריים.
תכונות
- פרימיטיבים של למידה חיזוקית מודולרית (ערכים, תשואות ומדיניות)
- אופטימיזציה JAX להאצת GPU/TPU ובידול אוטומטי
- תומך בפרדיגמות למידה תוך-מדיניות ומחוץ-מדיניות
- מיישם פונקציות ערך חלוקתיות ופונקציות ערך כלליות
- משתלב עם Haiku ו-Optax עבור רשתות נוירונים וצינורות אופטימיזציה
- בדיקות מקיפות ודוגמאות לשחזור ושימוש חינוכי
שפת תכנות
Python, Unix Shell
כל הקטגוריות
זוהי אפליקציה שניתן להוריד גם מאתר https://sourceforge.net/projects/rlax.mirror/. היא אוחסנה ב-OnWorks על מנת שניתן יהיה להפעיל אותה באופן מקוון בצורה הקלה ביותר מאחת ממערכות ההפעלה החינמיות שלנו.
