This is the Windows app named RLax whose latest release can be downloaded as RLax0.1.8sourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
ดาวน์โหลดและรันแอปชื่อ RLax ออนไลน์ด้วย OnWorks ได้ฟรี
ทำตามคำแนะนำเหล่านี้เพื่อเรียกใช้แอปนี้:
- 1. ดาวน์โหลดแอปพลิเคชั่นนี้ในพีซีของคุณ
- 2. เข้าไปที่ file manager https://www.onworks.net/myfiles.php?username=XXXXX ด้วยชื่อผู้ใช้ที่คุณต้องการ
- 3. อัปโหลดแอปพลิเคชันนี้ในตัวจัดการไฟล์ดังกล่าว
- 4. เริ่มโปรแกรมจำลองออนไลน์ของ OS OnWorks จากเว็บไซต์นี้ แต่โปรแกรมจำลองออนไลน์ของ Windows ที่ดีกว่า
- 5. จากระบบปฏิบัติการ Windows ของ OnWorks ที่คุณเพิ่งเริ่มต้น ไปที่ตัวจัดการไฟล์ของเรา https://www.onworks.net/myfiles.php?username=XXXXX พร้อมชื่อผู้ใช้ที่คุณต้องการ
- 6. ดาวน์โหลดแอปพลิเคชั่นและติดตั้ง
- 7. ดาวน์โหลดไวน์จากที่เก็บซอฟต์แวร์ลีนุกซ์ดิสทริบิวชันของคุณ เมื่อติดตั้งแล้ว คุณสามารถดับเบิลคลิกที่แอปเพื่อเรียกใช้แอปด้วย Wine คุณยังสามารถลองใช้ PlayOnLinux ซึ่งเป็นอินเทอร์เฟซแฟนซีบน Wine ที่จะช่วยคุณติดตั้งโปรแกรมและเกมยอดนิยมของ Windows
ไวน์เป็นวิธีเรียกใช้ซอฟต์แวร์ Windows บน Linux แต่ไม่จำเป็นต้องใช้ Windows Wine เป็นเลเยอร์ความเข้ากันได้ของ Windows แบบโอเพ่นซอร์สที่สามารถเรียกใช้โปรแกรม Windows ได้โดยตรงบนเดสก์ท็อป Linux โดยพื้นฐานแล้ว Wine พยายามนำ Windows กลับมาใช้ใหม่ให้เพียงพอตั้งแต่เริ่มต้น เพื่อให้สามารถเรียกใช้แอปพลิเคชัน Windows เหล่านั้นทั้งหมดโดยไม่จำเป็นต้องใช้ Windows จริงๆ
ภาพหน้าจอ
Ad
อาร์แล็กซ์
DESCRIPTION
RLax (ออกเสียงว่า “รีแลกซ์”) เป็นไลบรารีที่พัฒนาโดย Google DeepMind ซึ่งนำเสนอหน่วยการสร้างทางคณิตศาสตร์ที่นำกลับมาใช้ใหม่ได้สำหรับการสร้างตัวแทนการเรียนรู้แบบเสริมแรง (RL) แทนที่จะใช้อัลกอริทึมเต็มรูปแบบ RLax มุ่งเน้นไปที่การดำเนินการฟังก์ชันหลักที่สนับสนุนวิธีการ RL เช่น การคำนวณฟังก์ชันค่า ผลตอบแทน การไล่ระดับนโยบาย และเทอมการสูญเสีย ช่วยให้นักวิจัยสามารถประกอบตัวแทนของตนเองได้อย่างยืดหยุ่น RLax รองรับการเรียนรู้ทั้งแบบ on-policy และ off-policy รวมถึงวิธีการเรียนรู้แบบ value-based, policy-based และ model-based RLax สามารถคอมไพล์แบบ JIT ได้อย่างสมบูรณ์กับ JAX ทำให้สามารถประมวลผลประสิทธิภาพสูงบนแบ็กเอนด์ CPU, GPU และ TPU ไลบรารีนี้ใช้เครื่องมือสำหรับสมการเบลล์แมน การแจกแจงผลตอบแทน ฟังก์ชันค่าทั่วไป และการปรับให้เหมาะสมนโยบายทั้งในพื้นที่การดำเนินการแบบต่อเนื่องและแบบไม่ต่อเนื่อง RLax สามารถผสานรวมเข้ากับ Haiku (สำหรับการกำหนดโครงข่ายประสาทเทียม) และ Optax (สำหรับการปรับให้เหมาะสม) ของ DeepMind ได้อย่างราบรื่น ทำให้เป็นส่วนประกอบสำคัญในกระบวนการ RL แบบแยกส่วน
คุณสมบัติ
- การเรียนรู้แบบเสริมแรงแบบโมดูลาร์ (ค่า ผลตอบแทน และนโยบาย)
- JAX-optimized สำหรับการเร่งความเร็ว GPU/TPU และการแยกความแตกต่างอัตโนมัติ
- รองรับรูปแบบการเรียนรู้ทั้งแบบมีนโยบายและนอกนโยบาย
- นำฟังก์ชันค่าการกระจายและฟังก์ชันค่าทั่วไปไปใช้
- บูรณาการกับ Haiku และ Optax สำหรับเครือข่ายประสาทและไปป์ไลน์การเพิ่มประสิทธิภาพ
- การทดสอบและตัวอย่างที่ครอบคลุมสำหรับการทำซ้ำและการใช้เพื่อการศึกษา
ภาษาโปรแกรม
ไพธอน, ยูนิกซ์เชลล์
หมวดหมู่
นี่คือแอปพลิเคชันที่สามารถดึงข้อมูลจาก https://sourceforge.net/projects/rlax.mirror/ ได้ แอปพลิเคชันนี้โฮสต์อยู่ใน OnWorks เพื่อให้ใช้งานออนไลน์ได้ง่ายที่สุดจากระบบปฏิบัติการฟรีของเรา
