Volginstructies met feedback downloaden voor Linux

Dit is de Linux-app Following Instructions with Feedback, waarvan de nieuwste versie kan worden gedownload als following-instructions-human-feedbacksourcecode.tar.gz. Deze kan online worden uitgevoerd via de gratis hostingprovider OnWorks voor werkstations.

 
 

Download en gebruik online gratis de app Volgen van instructies met feedback met OnWorks.

Volg deze instructies om deze app uit te voeren:

- 1. Download deze applicatie op uw pc.

- 2. Voer in onze bestandsbeheerder https://www.onworks.net/myfiles.php?username=XXXXX in met de gebruikersnaam die u wilt.

- 3. Upload deze applicatie in zo'n bestandsbeheerder.

- 4. Start de OnWorks Linux online of Windows online emulator of MACOS online emulator vanaf deze website.

- 5. Ga vanuit het OnWorks Linux-besturingssysteem dat u zojuist hebt gestart naar onze bestandsbeheerder https://www.onworks.net/myfiles.php?username=XXXXX met de gewenste gebruikersnaam.

- 6. Download de applicatie, installeer hem en voer hem uit.

SCHERMSCHERMEN:


Instructies volgen met feedback


BESCHRIJVING:

De repository 'following-instructions-human-feedback' bevat de code en aanvullende materialen die ten grondslag liggen aan OpenAI's werk op het gebied van het trainen van taalmodellen (InstructGPT-modellen) die gebruikersinstructies beter volgen door middel van menselijke feedback. De repository bevat de modelkaart, voorbeelden van automatische evaluatie-uitvoer en labelrichtlijnen die in het proces worden gebruikt. Het is expliciet gekoppeld aan het artikel 'Training language models to follow instructions with human feedback' en dient als referentie voor hoe OpenAI annotatierichtlijnen verzamelt, voorkeursvergelijkingen uitvoert en modelgedrag evalueert. De repository is geen volledige implementatie van de volledige RLHF-pipeline, maar eerder een archiefhub die het gepubliceerde onderzoek ondersteunt en transparantie biedt over evaluatie- en menselijke labelnormen. Het bevat directory's zoals 'automatic-eval-samples' (voorbeelden van modeluitvoer op benchmarktaken) en een 'model-card.md' die het beoogde gedrag, de beperkingen en vooroordelen van de InstructGPT-modellen beschrijft.



Kenmerken

  • Archief met evaluatievoorbeelden van InstructGPT-experimenten
  • model-card.md beschrijft het gebruik van het model, beperkingen en veiligheidsoverwegingen
  • Etiketteringsrichtlijnen / annotatie-instructies voor menselijke evaluatoren
  • Gestructureerde map 'automatische evaluaties van monsters' met basislijn versus verfijnde uitkomsten
  • Transparantie over hoe OpenAI de rangschikking en uitlijning van modelvoorkeuren heeft gemeten
  • Links en verwijzingen naar het originele onderzoeksartikel en de documentatie



Categorieën

Onderwijs

Deze applicatie kan ook worden gedownload van https://sourceforge.net/projects/following-inst-feedback.mirror/. Deze is gehost in OnWorks, zodat deze eenvoudig online kan worden uitgevoerd via een van onze gratis besturingssystemen.



Nieuwste Linux & Windows online programma's


Categorieën om software en programma's voor Windows en Linux te downloaden