นี่คือแอป Linux ชื่อ Scalable Distributed Deep-RL ซึ่งสามารถดาวน์โหลดเวอร์ชันล่าสุดได้ที่ scalable_agentsourcecode.tar.gz สามารถใช้งานออนไลน์ได้บน OnWorks ซึ่งเป็นผู้ให้บริการโฮสติ้งฟรีสำหรับเวิร์กสเตชัน
ดาวน์โหลดและใช้งานแอปออนไลน์ชื่อ Scalable Distributed Deep-RL พร้อม OnWorks ได้ฟรี
ทำตามคำแนะนำเหล่านี้เพื่อเรียกใช้แอปนี้:
- 1. ดาวน์โหลดแอปพลิเคชั่นนี้ในพีซีของคุณ
- 2. เข้าไปที่ file manager https://www.onworks.net/myfiles.php?username=XXXXX ด้วยชื่อผู้ใช้ที่คุณต้องการ
- 3. อัปโหลดแอปพลิเคชันนี้ในตัวจัดการไฟล์ดังกล่าว
- 4. เริ่มโปรแกรมจำลองออนไลน์ของ OnWorks Linux หรือ Windows ออนไลน์ หรือโปรแกรมจำลองออนไลน์ MACOS จากเว็บไซต์นี้
- 5. จาก OnWorks Linux OS คุณเพิ่งเริ่มต้น ไปที่ตัวจัดการไฟล์ของเรา https://www.onworks.net/myfiles.php?username=XXXXX พร้อมชื่อผู้ใช้ที่คุณต้องการ
- 6. ดาวน์โหลดแอปพลิเคชั่น ติดตั้ง และเรียกใช้
ภาพหน้าจอ:
การกระจายแบบลึกที่ปรับขนาดได้
รายละเอียด:
Scalable Agent คือการใช้งานแบบเปิดของ IMPALA (Importance Weighted Actor-Learner Architectures) ซึ่งเป็นเฟรมเวิร์กการเรียนรู้แบบเสริมแรงแบบกระจายที่ปรับขนาดได้สูง ซึ่งพัฒนาโดย Google DeepMind IMPALA นำเสนอกระบวนทัศน์ใหม่สำหรับการฝึกอบรมเอเจนต์อย่างมีประสิทธิภาพในสภาพแวดล้อมขนาดใหญ่ โดยการแยกกระบวนการปฏิบัติงานและกระบวนการเรียนรู้ออกจากกัน ในสถาปัตยกรรมนี้ กระบวนการปฏิบัติงานหลายตัวจะโต้ตอบกับสภาพแวดล้อมของตนแบบขนานเพื่อรวบรวมวิถี จากนั้นจะถูกส่งไปยังผู้เรียนส่วนกลางแบบอะซิงโครนัสเพื่ออัปเดตนโยบาย ผู้เรียนจะใช้การถ่วงน้ำหนักความสำคัญเพื่อแก้ไขความล่าช้าของนโยบายระหว่างผู้ปฏิบัติงานและผู้เรียน ทำให้การฝึกอบรมนอกนโยบายมีความเสถียรในระดับขนาดใหญ่ การออกแบบนี้ช่วยให้ระบบสามารถปรับขนาดได้อย่างมีประสิทธิภาพไปยังสภาพแวดล้อมหลายร้อยแห่งและเฟรมหลายพันล้านเฟรม ในขณะที่ยังคงประสิทธิภาพและความเสถียรของตัวอย่าง การใช้งานนี้รองรับการฝึกอบรมใน DeepMind Lab (DMLab) และยังได้รับการดัดแปลงสำหรับสภาพแวดล้อมอื่นๆ เช่น Atari และ Street View
คุณสมบัติ
- ใช้ IMPALA ซึ่งเป็นกรอบการทำงานการเรียนรู้การเสริมแรงเชิงลึกแบบกระจายที่ปรับขนาดได้
- รองรับสถาปัตยกรรมผู้เรียน-ผู้แสดงแบบอะซิงโครนัสพร้อมการถ่วงน้ำหนักความสำคัญ
- ฝึกอบรมตัวแทนอย่างมีประสิทธิภาพในสภาพแวดล้อมขนาดใหญ่ (เช่น DMLab-30, Atari)
- รวมการแบ่งกลุ่มแบบไดนามิกเพื่อเพิ่มประสิทธิภาพการรับส่งข้อมูล
- ใช้งานได้กับ DeepMind Sonnet และ TensorFlow
- จัดเตรียมการตั้งค่า Dockerfile สำหรับการฝึกอบรมแบบเครื่องเดียวหรือแบบกระจายที่ทำซ้ำได้
ภาษาโปรแกรม
C++, ไพธอน
หมวดหมู่
นี่คือแอปพลิเคชันที่สามารถดึงข้อมูลจาก https://sourceforge.net/projects/scalable-dist-deep-rl.mirror/ ได้ แอปพลิเคชันนี้โฮสต์อยู่ใน OnWorks เพื่อให้ใช้งานออนไลน์ได้ง่ายที่สุดจากระบบปฏิบัติการฟรีของเรา