GoGPT Best VPN GoSearch

Favicon OnWorks

Urmând instrucțiunile cu feedback pentru descărcare pentru Linux

Descărcare gratuită a aplicației Linux Urmând instrucțiunile cu feedback pentru a rula online în Ubuntu online, Fedora online sau Debian online

Aceasta este aplicația Linux numită Following Instructions with Feedback, a cărei ultimă versiune poate fi descărcată sub numele following-instructions-human-feedbacksourcecode.tar.gz. Poate fi rulată online în furnizorul de găzduire gratuită OnWorks pentru stații de lucru.

Descărcați și rulați online gratuit această aplicație numită Urmărirea instrucțiunilor cu feedback cu OnWorks.

Urmați aceste instrucțiuni pentru a rula această aplicație:

- 1. Ați descărcat această aplicație pe computer.

- 2. Introduceți în managerul nostru de fișiere https://www.onworks.net/myfiles.php?username=XXXXX cu numele de utilizator pe care îl doriți.

- 3. Încărcați această aplicație într-un astfel de manager de fișiere.

- 4. Porniți emulatorul online OnWorks Linux sau Windows online sau emulatorul online MACOS de pe acest site web.

- 5. Din sistemul de operare OnWorks Linux pe care tocmai l-ați pornit, accesați managerul nostru de fișiere https://www.onworks.net/myfiles.php?username=XXXXX cu numele de utilizator dorit.

- 6. Descărcați aplicația, instalați-o și rulați-o.

SCREENSHOTS

Ad


Urmarea instrucțiunilor cu feedback


DESCRIERE

Depozitul following-instructions-human-feedback conține codul și materialele suplimentare care stau la baza activității OpenAI în antrenarea modelelor lingvistice (modele InstructGPT) care urmează mai bine instrucțiunile utilizatorului prin feedback uman. Depozitul găzduiește fișa modelului, exemple de rezultate ale evaluării automate și instrucțiuni de etichetare utilizate în acest proces. Acesta este legat în mod explicit de documentul „Antrenarea modelelor lingvistice pentru a urma instrucțiunile cu feedback uman” și servește drept referință pentru modul în care OpenAI colectează instrucțiuni de adnotare, rulează comparații de preferințe și evaluează comportamentele modelelor. Depozitul nu este o implementare completă a întregului flux RLHF, ci mai degrabă un hub de arhivare care susține cercetarea publicată - oferind transparență în ceea ce privește standardele de evaluare și etichetare umană. Acesta include directoare precum automatic-eval-samples (exemple de rezultate ale modelului pentru sarcini de referință) și un fișier model-card.md care descrie comportamentul preconizat, limitările și prejudecățile modelelor InstructGPT.



Categorii

  • Arhivă cu rezultate ale eșantionului de evaluare din experimentele InstructGPT
  • model-card.md descrie utilizarea modelului, limitele și considerațiile de siguranță
  • Instrucțiuni de etichetare / adnotare utilizate pentru evaluatorii umani
  • Dosar structurat „automatic-eval-samples” care prezintă rezultatele de bază față de cele ajustate fin
  • Transparență privind modul în care OpenAI a măsurat clasamentul și alinierea preferințelor modelului
  • Linkuri și referințe către lucrarea de cercetare și documentația originală



Categorii

Educaţie

Aceasta este o aplicație care poate fi descărcată și de la https://sourceforge.net/projects/following-inst-feedback.mirror/. A fost găzduită în OnWorks pentru a putea fi rulată online în cel mai simplu mod de pe unul dintre sistemele noastre de operare gratuite.


Servere și stații de lucru gratuite

Descărcați aplicații Windows și Linux

Comenzi Linux

Ad




×
publicitate
❤️Cumpără, rezervă sau cumpără aici — gratuit, contribuind la menținerea serviciilor gratuite.