Это приложение для Linux под названием Following Instructions with Feedback, последнюю версию которого можно скачать в файле following-instructions-human-feedbacksourcecode.tar.gz. Его можно запустить онлайн на бесплатном хостинг-провайдере OnWorks для рабочих станций.
Бесплатно скачайте и запустите онлайн это приложение под названием «Следование инструкциям с обратной связью с OnWorks».
Следуйте этим инструкциям, чтобы запустить это приложение:
- 1. Загрузил это приложение на свой компьютер.
- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 3. Загрузите это приложение в такой файловый менеджер.
- 4. Запустите онлайн-эмулятор OnWorks Linux или Windows или онлайн-эмулятор MACOS с этого веб-сайта.
- 5. В только что запущенной ОС OnWorks Linux перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 6. Скачайте приложение, установите его и запустите.
СКРИНШОТЫ
Ad
Следуя инструкциям с обратной связью
ОПИСАНИЕ
Репозиторий following-instructions-human-feedback содержит код и дополнительные материалы, лежащие в основе работы OpenAI над обучением языковых моделей (моделей InstructGPT), которые лучше следуют инструкциям пользователя благодаря обратной связи с человеком. В репозитории размещены карточка модели, примеры результатов автоматической оценки и рекомендации по маркировке, используемые в этом процессе. Он явно связан с документом «Обучение языковых моделей следованию инструкциям с обратной связью с человеком» и служит справочником по тому, как OpenAI собирает рекомендации по аннотациям, проводит сравнение предпочтений и оценивает поведение моделей. Репозиторий не является полной реализацией всего конвейера RLHF, а скорее архивным центром, поддерживающим опубликованные исследования, обеспечивая прозрачность в отношении стандартов оценки и маркировки, предоставляемых человеком. Он включает в себя такие каталоги, как automatic-eval-samples (примеры результатов моделей в тестовых задачах) и model-card.md, описывающий предполагаемое поведение, ограничения и смещения моделей InstructGPT.
Особенности
- Архив результатов оценочных образцов экспериментов InstructGPT
- model-card.md, описывающий использование модели, ограничения и меры безопасности
- Руководства по маркировке/инструкции по аннотациям, используемые для экспертов-оценщиков
- Структурированная папка «automatic-eval-samples», показывающая базовые и точно настроенные результаты
- Прозрачность в отношении того, как OpenAI измеряет рейтинг предпочтений и соответствие моделей
- Ссылки на оригинальную исследовательскую работу и документацию
Категории
Это приложение также можно скачать по адресу https://sourceforge.net/projects/following-inst-feedback.mirror/. Оно размещено на платформе OnWorks для максимально удобного запуска онлайн через одну из наших бесплатных операционных систем.
