Це програма для Linux під назвою «Following Instructions with Feedback» («Слідуючи інструкціям зі зворотним зв’язком»), останню версію якої можна завантажити як following-instructions-human-feedbacksourcecode.tar.gz. Її можна запускати онлайн на безкоштовному хостинг-провайдері OnWorks для робочих станцій.
Завантажте та запустіть онлайн цю програму під назвою «Дотримуйтесь інструкцій зі зворотним зв’язком з OnWorks» безкоштовно.
Дотримуйтесь цих інструкцій, щоб запустити цю програму:
- 1. Завантажив цю програму на свій ПК.
- 2. Введіть у наш файловий менеджер https://www.onworks.net/myfiles.php?username=XXXXX із потрібним ім'ям користувача.
- 3. Завантажте цю програму в такий файловий менеджер.
- 4. Запустіть онлайн-емулятор OnWorks Linux або Windows або онлайн-емулятор MACOS з цього веб-сайту.
- 5. З ОС OnWorks Linux, яку ви щойно запустили, перейдіть до нашого файлового менеджера https://www.onworks.net/myfiles.php?username=XXXXX з потрібним іменем користувача.
- 6. Завантажте програму, встановіть її та запустіть.
ЕКРАНИ
Ad
Виконання інструкцій зі зворотним зв'язком
ОПИС
Репозиторій following-instructions-human-feedback містить код та додаткові матеріали, що лежать в основі роботи OpenAI в моделях навчальної мови (моделі InstructGPT), які краще відповідають інструкціям користувача завдяки людському зворотному зв'язку. Репозиторій містить картку моделі, зразки автоматичних результатів оцінювання та рекомендації щодо маркування, що використовуються в процесі. Він чітко пов'язаний зі статтею «Моделі навчальної мови для виконання інструкцій з людським зворотним зв'язком» та служить довідником щодо того, як OpenAI збирає рекомендації щодо анотацій, проводить порівняння уподобань та оцінює поведінку моделей. Репозиторій не є повною реалізацією всього конвеєра RLHF, а радше архівним центром, що підтримує опубліковані дослідження, забезпечуючи прозорість щодо стандартів оцінювання та людського маркування. Він включає такі каталоги, як automatic-eval-samples (зразки результатів моделей для завдань порівняльного тестування) та model-card.md, який описує передбачувану поведінку, обмеження та упередження моделей InstructGPT.
Функції
- Архів результатів оцінювання зразків експериментів InstructGPT
- model-card.md з описом використання моделі, обмежень та міркувань безпеки
- Інструкції з маркування / інструкції щодо анотацій, що використовуються оцінювачами-людьми
- Структурована папка «automatic-eval-samples», що показує базові та точно налаштовані результати
- Прозорість щодо того, як OpenAI вимірював ранжування та узгодження уподобань моделей
- Посилання та посилання на оригінальну дослідницьку роботу та документацію
Категорії
Цю програму також можна завантажити з https://sourceforge.net/projects/following-inst-feedback.mirror/. Вона розміщена на OnWorks для найпростішого запуску онлайн з однієї з наших безкоштовних операційних систем.
