นี่คือแอป Linux ชื่อ Following Instructions with Feedback ซึ่งสามารถดาวน์โหลดเวอร์ชันล่าสุดได้ที่ following-instructions-human-feedbacksourcecode.tar.gz สามารถใช้งานออนไลน์ได้บน OnWorks ซึ่งเป็นผู้ให้บริการโฮสติ้งฟรีสำหรับเวิร์กสเตชัน
ดาวน์โหลดและใช้งานแอปออนไลน์ชื่อ Following Instructions with Feedback with OnWorks ได้ฟรี
ทำตามคำแนะนำเหล่านี้เพื่อเรียกใช้แอปนี้:
- 1. ดาวน์โหลดแอปพลิเคชั่นนี้ในพีซีของคุณ
- 2. เข้าไปที่ file manager https://www.onworks.net/myfiles.php?username=XXXXX ด้วยชื่อผู้ใช้ที่คุณต้องการ
- 3. อัปโหลดแอปพลิเคชันนี้ในตัวจัดการไฟล์ดังกล่าว
- 4. เริ่มโปรแกรมจำลองออนไลน์ของ OnWorks Linux หรือ Windows ออนไลน์ หรือโปรแกรมจำลองออนไลน์ MACOS จากเว็บไซต์นี้
- 5. จาก OnWorks Linux OS คุณเพิ่งเริ่มต้น ไปที่ตัวจัดการไฟล์ของเรา https://www.onworks.net/myfiles.php?username=XXXXX พร้อมชื่อผู้ใช้ที่คุณต้องการ
- 6. ดาวน์โหลดแอปพลิเคชั่น ติดตั้ง และเรียกใช้
ภาพหน้าจอ
Ad
ปฏิบัติตามคำแนะนำพร้อมข้อเสนอแนะ
DESCRIPTION
คลังข้อมูล following-instructions-human-feedback ประกอบด้วยโค้ดและเอกสารประกอบที่สนับสนุนงานของ OpenAI ในโมเดลภาษาฝึก (โมเดล InstructGPT) ที่สามารถปฏิบัติตามคำสั่งของผู้ใช้ได้ดีขึ้นผ่านฟีดแบ็กจากมนุษย์ คลังข้อมูลนี้ประกอบด้วยการ์ดโมเดล ตัวอย่างผลลัพธ์การประเมินอัตโนมัติ และแนวทางการติดฉลากที่ใช้ในกระบวนการ คลังข้อมูลนี้เชื่อมโยงอย่างชัดเจนกับเอกสาร “การฝึกโมเดลภาษาให้ปฏิบัติตามคำสั่งด้วยฟีดแบ็กจากมนุษย์” และทำหน้าที่เป็นข้อมูลอ้างอิงสำหรับวิธีที่ OpenAI รวบรวมแนวทางการใส่คำอธิบายประกอบ เปรียบเทียบค่ากำหนด และประเมินพฤติกรรมของโมเดล คลังข้อมูลนี้ไม่ใช่การนำ RLHF ไปใช้งานอย่างเต็มรูปแบบ แต่เป็นศูนย์กลางการจัดเก็บเอกสารที่สนับสนุนงานวิจัยที่ตีพิมพ์ ซึ่งให้ความโปร่งใสเกี่ยวกับมาตรฐานการประเมินและการติดฉลากจากมนุษย์ คลังข้อมูลประกอบด้วยไดเรกทอรีต่างๆ เช่น automatic-eval-samples (ตัวอย่างผลลัพธ์ของโมเดลในงานทดสอบประสิทธิภาพ) และ model-card.md ที่อธิบายพฤติกรรม ข้อจำกัด และอคติที่โมเดล InstructGPT ตั้งใจไว้
คุณสมบัติ
- คลังตัวอย่างผลลัพธ์การประเมินจากการทดลอง InstructGPT
- model-card.md อธิบายการใช้งานโมเดล ข้อจำกัด และข้อควรพิจารณาด้านความปลอดภัย
- แนวทางการติดฉลาก/คำแนะนำคำอธิบายประกอบที่ใช้สำหรับผู้ประเมินมนุษย์
- โฟลเดอร์ "ตัวอย่างการประเมินอัตโนมัติ" ที่มีโครงสร้างแสดงผลลัพธ์พื้นฐานเทียบกับผลลัพธ์ที่ปรับแต่งอย่างละเอียด
- ความโปร่งใสเกี่ยวกับวิธีการที่ OpenAI วัดการจัดอันดับความชอบและการจัดตำแหน่งโมเดล
- ลิงก์และเอกสารอ้างอิงไปยังเอกสารวิจัยและเอกสารต้นฉบับ
หมวดหมู่
นี่คือแอปพลิเคชันที่สามารถดึงข้อมูลจาก https://sourceforge.net/projects/following-inst-feedback.mirror/ ได้ แอปพลิเคชันนี้โฮสต์อยู่ใน OnWorks เพื่อให้ใช้งานออนไลน์ได้ง่ายที่สุดจากระบบปฏิบัติการฟรีของเรา
