Ini adalah aplikasi Linux bernama Following Instructions with Feedback yang rilis terbarunya dapat diunduh sebagai following-instructions-human-feedbacksourcecode.tar.gz. Aplikasi ini dapat dijalankan secara daring di penyedia hosting gratis OnWorks untuk workstation.
Unduh dan jalankan aplikasi ini secara daring bernama Following Instructions with Feedback with OnWorks secara gratis.
Ikuti petunjuk ini untuk menjalankan aplikasi ini:
- 1. Download aplikasi ini di PC Anda.
- 2. Masuk ke file manager kami https://www.onworks.net/myfiles.php?username=XXXXX dengan username yang anda inginkan.
- 3. Upload aplikasi ini di filemanager tersebut.
- 4. Jalankan emulator online OnWorks Linux atau Windows online atau emulator online MACOS dari situs web ini.
- 5. Dari OS Linux OnWorks yang baru saja Anda mulai, buka file manager kami https://www.onworks.net/myfiles.php?username=XXXXX dengan nama pengguna yang Anda inginkan.
- 6. Download aplikasinya, install dan jalankan.
Tangkapan layar
Ad
Mengikuti Instruksi dengan Umpan Balik
DESKRIPSI
Repositori following-instructions-human-feedback berisi kode dan materi tambahan yang mendukung pekerjaan OpenAI dalam melatih model bahasa (model InstructGPT) yang lebih baik dalam mengikuti instruksi pengguna melalui umpan balik manusia. Repositori ini menyimpan kartu model, contoh keluaran evaluasi otomatis, dan panduan pelabelan yang digunakan dalam proses tersebut. Repositori ini secara eksplisit terkait dengan makalah "Melatih model bahasa untuk mengikuti instruksi dengan umpan balik manusia", dan berfungsi sebagai referensi tentang bagaimana OpenAI mengumpulkan panduan anotasi, menjalankan perbandingan preferensi, dan mengevaluasi perilaku model. Repositori ini bukanlah implementasi penuh dari keseluruhan alur kerja RLHF, melainkan pusat arsip yang mendukung penelitian yang telah dipublikasikan—memberikan transparansi seputar standar evaluasi dan pelabelan manusia. Repositori ini mencakup direktori seperti automatic-eval-samples (contoh keluaran model pada tugas benchmark) dan model-card.md yang menjelaskan perilaku, batasan, dan bias yang diinginkan dari model InstructGPT.
Fitur
- Arsip contoh keluaran evaluasi dari eksperimen InstructGPT
- model-card.md yang menjelaskan penggunaan model, batasan, dan pertimbangan keselamatan
- Pedoman pelabelan / instruksi anotasi yang digunakan untuk evaluator manusia
- Folder “automatic-eval-samples” terstruktur yang menunjukkan keluaran dasar vs keluaran yang telah disesuaikan
- Transparansi seputar cara OpenAI mengukur peringkat dan penyelarasan preferensi model
- Tautan dan referensi ke makalah penelitian dan dokumentasi asli
KATEGORI
Ini adalah aplikasi yang juga dapat diunduh dari https://sourceforge.net/projects/following-inst-feedback.mirror/. Aplikasi ini dihosting di OnWorks agar dapat dijalankan daring dengan cara termudah dari salah satu Sistem Operasi gratis kami.
