นี่คือแอป Linux ชื่อ OpenRLHF ซึ่งสามารถดาวน์โหลดเวอร์ชันล่าสุดได้ที่ PatchReleasev0.8.9.post1sourcecode.tar.gz สามารถรันออนไลน์ได้บน OnWorks ซึ่งเป็นผู้ให้บริการโฮสติ้งฟรีสำหรับเวิร์กสเตชัน
ดาวน์โหลดและรันแอปออนไลน์ชื่อ OpenRLHF พร้อม OnWorks ได้ฟรี
ทำตามคำแนะนำเหล่านี้เพื่อเรียกใช้แอปนี้:
- 1. ดาวน์โหลดแอปพลิเคชั่นนี้ในพีซีของคุณ
- 2. เข้าไปที่ file manager https://www.onworks.net/myfiles.php?username=XXXXX ด้วยชื่อผู้ใช้ที่คุณต้องการ
- 3. อัปโหลดแอปพลิเคชันนี้ในตัวจัดการไฟล์ดังกล่าว
- 4. เริ่มโปรแกรมจำลองออนไลน์ของ OnWorks Linux หรือ Windows ออนไลน์ หรือโปรแกรมจำลองออนไลน์ MACOS จากเว็บไซต์นี้
- 5. จาก OnWorks Linux OS คุณเพิ่งเริ่มต้น ไปที่ตัวจัดการไฟล์ของเรา https://www.onworks.net/myfiles.php?username=XXXXX พร้อมชื่อผู้ใช้ที่คุณต้องการ
- 6. ดาวน์โหลดแอปพลิเคชั่น ติดตั้ง และเรียกใช้
ภาพหน้าจอ
Ad
โอเพ่นอาร์แอลเอชเอฟ
DESCRIPTION
OpenRLHF เป็นกรอบงานสำหรับการเรียนรู้แบบเสริมแรงด้วยข้อเสนอแนะจากมนุษย์ (RLHF) ที่ใช้งานง่าย ปรับขนาดได้ และมีประสิทธิภาพสูง โดยรองรับเทคนิคการฝึกอบรมและสถาปัตยกรรมโมเดลต่างๆ
คุณสมบัติ
- นำ Proximal Policy Optimization (PPO) มาใช้สำหรับการฝึกอบรม
- รองรับการเพิ่มประสิทธิภาพการตั้งค่าโดยตรงแบบวนซ้ำ (DPO)
- ให้การปรับจูนระดับต่ำ (LoRA) เพื่อการปรับแต่งที่มีประสิทธิภาพ
- รวมถึง RingAttention และ Retrieval-augmented Fine-Tuning (RFT)
- มาตราส่วนถึงรุ่นใหญ่ที่มีประสิทธิภาพสูง
- นำเสนอเอกสารและตัวอย่างที่ครอบคลุม
ภาษาโปรแกรม
หลาม
หมวดหมู่
นี่คือแอปพลิเคชันที่สามารถดึงมาจาก https://sourceforge.net/projects/openrlhf.mirror/ ได้ แอปพลิเคชันนี้โฮสต์อยู่ใน OnWorks เพื่อให้เรียกใช้ทางออนไลน์ได้ง่ายที่สุดจากระบบปฏิบัติการฟรีของเรา