Suivez les instructions avec commentaires pour télécharger pour Linux

Il s'agit de l'application Linux « Feedback » dont la dernière version est téléchargeable sous le lien following-instructions-human-feedbacksourcecode.tar.gz. Elle peut être exécutée en ligne sur l'hébergeur gratuit OnWorks pour postes de travail.

 
 

Téléchargez et exécutez en ligne gratuitement cette application nommée Following Instructions with Feedback with OnWorks.

Suivez ces instructions pour exécuter cette application :

- 1. Téléchargé cette application sur votre PC.

- 2. Entrez dans notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous voulez.

- 3. Téléchargez cette application dans ce gestionnaire de fichiers.

- 4. Démarrez l'émulateur en ligne OnWorks Linux ou Windows en ligne ou l'émulateur en ligne MACOS à partir de ce site Web.

- 5. Depuis le système d'exploitation OnWorks Linux que vous venez de démarrer, accédez à notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous souhaitez.

- 6. Téléchargez l'application, installez-la et exécutez-la.

CAPTURES D'ÉCRAN:


Suivre les instructions avec commentaires


DESCRIPTION:

Le dépôt following-instructions-human-feedback contient le code et les ressources complémentaires qui sous-tendent les travaux d'OpenAI sur l'entraînement des modèles de langage (modèles InstructGPT) afin qu'ils suivent mieux les instructions utilisateur grâce au retour humain. Ce dépôt héberge la fiche modèle, des exemples de résultats d'évaluation automatique et les directives d'étiquetage utilisées dans le processus. Il est explicitement lié à l'article « Training language models to follow instructions with human feedback » et sert de référence pour la manière dont OpenAI collecte les directives d'annotation, effectue les comparaisons de préférences et évalue les comportements des modèles. Ce dépôt n'est pas une implémentation complète du pipeline RLHF, mais plutôt un centre d'archivage des recherches publiées, assurant ainsi la transparence des normes d'évaluation et d'étiquetage humain. Il comprend des répertoires tels que automatic-eval-samples (échantillons de résultats de modèles issus de tâches de référence) et un fichier model-card.md qui décrit le comportement attendu, les limites et les biais des modèles InstructGPT.



Fonctionnement

  • Archives des résultats d'évaluation des expériences InstructGPT
  • model-card.md décrivant l'utilisation du modèle, ses limites et les considérations de sécurité
  • Directives d'étiquetage / instructions d'annotation utilisées pour les évaluateurs humains
  • Dossier structuré « échantillons d'évaluation automatique » présentant les résultats de base et les résultats affinés
  • Transparence sur la façon dont OpenAI a mesuré le classement et l'alignement des préférences des modèles
  • Liens et références vers le document de recherche original et la documentation



Catégories

Education

Cette application peut également être téléchargée depuis https://sourceforge.net/projects/following-inst-feedback.mirror/. Elle est hébergée sur OnWorks afin de pouvoir être exécutée en ligne plus facilement depuis l'un de nos systèmes d'exploitation gratuits.



Derniers programmes en ligne Linux et Windows


Catégories à télécharger Logiciels et programmes pour Windows et Linux