Ini ialah apl Linux yang dinamakan Mengikuti Arahan dengan Maklum Balas yang keluaran terbaharunya boleh dimuat turun sebagai following-instructions-human-feedbacksourcecode.tar.gz. Ia boleh dijalankan dalam talian dalam penyedia pengehosan percuma OnWorks untuk stesen kerja.
Muat turun dan jalankan dalam talian apl bernama Mengikuti Arahan dengan Maklum Balas dengan OnWorks ini secara percuma.
Ikut arahan ini untuk menjalankan apl ini:
- 1. Memuat turun aplikasi ini dalam PC anda.
- 2. Masukkan dalam pengurus fail kami https://www.onworks.net/myfiles.php?username=XXXXX dengan nama pengguna yang anda mahukan.
- 3. Muat naik aplikasi ini dalam pengurus filem tersebut.
- 4. Mulakan OnWorks Linux dalam talian atau emulator dalam talian Windows atau emulator dalam talian MACOS dari tapak web ini.
- 5. Daripada OS Linux OnWorks yang baru anda mulakan, pergi ke pengurus fail kami https://www.onworks.net/myfiles.php?username=XXXX dengan nama pengguna yang anda mahukan.
- 6. Muat turun aplikasi, pasang dan jalankan.
SKRIN
Ad
Mengikuti Arahan dengan Maklum Balas
DESCRIPTION
Repositori arahan-manusia-maklum balas berikut mengandungi kod dan bahan tambahan yang menyokong kerja OpenAI dalam model bahasa latihan (model InstructGPT) yang lebih mengikuti arahan pengguna melalui maklum balas manusia. Repo mengehoskan kad model, sampel output penilaian automatik dan garis panduan pelabelan yang digunakan dalam proses. Ia secara eksplisit terikat dengan kertas "Melatih model bahasa untuk mengikuti arahan dengan maklum balas manusia", dan berfungsi sebagai rujukan untuk cara OpenAI mengumpul garis panduan anotasi, menjalankan perbandingan keutamaan dan menilai tingkah laku model. Repositori bukanlah pelaksanaan penuh bagi keseluruhan saluran paip RLHF, sebaliknya hab arkib yang menyokong penyelidikan yang diterbitkan—menyediakan ketelusan sekitar penilaian dan piawaian pelabelan manusia. Ia termasuk direktori seperti automatic-eval-samples (sampel output model pada tugasan penanda aras) dan model-card.md yang menerangkan tingkah laku, had dan berat sebelah model InstructGPT yang dimaksudkan.
Ciri-ciri
- Arkib output sampel penilaian daripada eksperimen InstructGPT
- model-card.md menerangkan penggunaan model, had dan pertimbangan keselamatan
- Garis panduan pelabelan / arahan anotasi yang digunakan untuk penilai manusia
- Folder "sampel-eval-automatik" berstruktur menunjukkan garis dasar lwn output diperhalusi
- Ketelusan tentang cara OpenAI mengukur kedudukan dan penjajaran keutamaan model
- Pautan dan rujukan kepada kertas penyelidikan dan dokumentasi asal
Kategori
Ini adalah aplikasi yang juga boleh diambil dari https://sourceforge.net/projects/following-inst-feedback.mirror/. Ia telah dihoskan dalam OnWorks untuk dijalankan dalam talian dengan cara yang paling mudah daripada salah satu Sistem Operasi percuma kami.
