זוהי אפליקציית לינוקס בשם "הפעלת הוראות עם משוב", שאת הגרסה האחרונה שלה ניתן להוריד בשם following-instructions-human-feedbacksourcecode.tar.gz. ניתן להריץ אותה באופן מקוון בספק האירוח החינמי OnWorks לתחנות עבודה.
הורד והפעל אונליין את האפליקציה הזו בשם "עקוב אחר הוראות עם משוב באמצעות OnWorks" בחינם.
בצע את ההוראות הבאות כדי להפעיל את האפליקציה הזו:
- 1. הורד את היישום הזה למחשב שלך.
- 2. הזן במנהל הקבצים שלנו https://www.onworks.net/myfiles.php?username=XXXXX עם שם המשתמש שאתה רוצה.
- 3. העלה את היישום הזה במנהל קבצים כזה.
- 4. הפעל את האמולטור המקוון של OnWorks Linux או Windows מקוון או אמולטור מקוון של MACOS מאתר זה.
- 5. ממערכת ההפעלה OnWorks Linux שזה עתה התחלת, עבור אל מנהל הקבצים שלנו https://www.onworks.net/myfiles.php?username=XXXXX עם שם המשתמש הרצוי.
- 6. הורד את האפליקציה, התקן אותה והפעל אותה.
בצילומי מסך
Ad
ביצוע הוראות עם משוב
תיאור
מאגר following-instructions-human-feedback מכיל את הקוד וחומרים משלימים התומכים בעבודתה של OpenAI באימון מודלים של שפות (מודלי InstructGPT) שעוקבים טוב יותר אחר הוראות המשתמש באמצעות משוב אנושי. המאגר מארח את כרטיס המודל, פלטי הערכה אוטומטיים לדוגמה והנחיות תיוג המשמשות בתהליך. הוא קשור במפורש למאמר "האימון מודלים של שפות לעקוב אחר הוראות עם משוב אנושי", ומשמש כמקור עזר לאופן שבו OpenAI אוספת הנחיות ביאור, מפעילה השוואות העדפות ומעריכה התנהגויות מודל. המאגר אינו יישום מלא של צינור RLHF כולו, אלא מרכז ארכיוני התומך במחקר שפורסם - ומספק שקיפות סביב סטנדרטים של הערכה ותיוג אנושי. הוא כולל ספריות כגון automatic-eval-samples (דוגמאות של פלטי מודל במשימות ביצועים) ו-model-card.md המתאר את ההתנהגות, המגבלות וההטיות המיועדות של מודלי InstructGPT.
תכונות
- ארכיון של פלטי הערכה לדוגמה מניסויי InstructGPT
- model-card.md המתאר את השימוש במודל, מגבלותיו ושיקולי הבטיחות שלו
- הנחיות תיוג / הוראות ביאור המשמשות מעריכים אנושיים
- תיקייה מובנית של "eval-samples" המציגה תוצאות בסיסיות לעומת תוצאות מכווננות עדינה
- שקיפות סביב האופן שבו OpenAI מדד את דירוג העדפות המודל ויישורו
- קישורים והפניות למאמר המחקר ולתיעוד המקוריים
כל הקטגוריות
זוהי אפליקציה שניתן להוריד גם מאתר https://sourceforge.net/projects/following-inst-feedback.mirror/. היא אוחסנה ב-OnWorks על מנת שניתן יהיה להפעיל אותה באופן מקוון בצורה הקלה ביותר מאחת ממערכות ההפעלה החינמיות שלנו.
