ഇതാണ് Following Instructions with Feedback എന്ന് പേരിട്ടിരിക്കുന്ന Linux ആപ്പ്, ഇതിന്റെ ഏറ്റവും പുതിയ പതിപ്പ് following-instructions-human-feedbacksourcecode.tar.gz ആയി ഡൗൺലോഡ് ചെയ്യാം. വർക്ക്സ്റ്റേഷനുകൾക്കായുള്ള സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവായ OnWorks-ൽ ഇത് ഓൺലൈനായി പ്രവർത്തിപ്പിക്കാം.
OnWorks-നൊപ്പം ഫീഡ്ബാക്ക് ഉപയോഗിച്ച് പിന്തുടരൽ നിർദ്ദേശങ്ങൾ എന്ന് പേരിട്ടിരിക്കുന്ന ഈ ആപ്പ് സൗജന്യമായി ഓൺലൈനായി ഡൗൺലോഡ് ചെയ്ത് പ്രവർത്തിപ്പിക്കുക.
ഈ ആപ്പ് പ്രവർത്തിപ്പിക്കുന്നതിന് ഈ നിർദ്ദേശങ്ങൾ പാലിക്കുക:
- 1. നിങ്ങളുടെ പിസിയിൽ ഈ ആപ്ലിക്കേഷൻ ഡൗൺലോഡ് ചെയ്തു.
- 2. ഞങ്ങളുടെ ഫയൽ മാനേജറിൽ https://www.onworks.net/myfiles.php?username=XXXXX എന്നതിൽ നിങ്ങൾക്ക് ആവശ്യമുള്ള ഉപയോക്തൃനാമം നൽകുക.
- 3. അത്തരം ഫയൽമാനേജറിൽ ഈ ആപ്ലിക്കേഷൻ അപ്ലോഡ് ചെയ്യുക.
- 4. ഈ വെബ്സൈറ്റിൽ നിന്ന് OnWorks Linux ഓൺലൈനോ Windows ഓൺലൈൻ എമുലേറ്ററോ MACOS ഓൺലൈൻ എമുലേറ്ററോ ആരംഭിക്കുക.
- 5. നിങ്ങൾ ഇപ്പോൾ ആരംഭിച്ച OnWorks Linux OS-ൽ നിന്ന്, നിങ്ങൾക്ക് ആവശ്യമുള്ള ഉപയോക്തൃനാമത്തോടുകൂടിയ ഞങ്ങളുടെ ഫയൽ മാനേജർ https://www.onworks.net/myfiles.php?username=XXXXX എന്നതിലേക്ക് പോകുക.
- 6. ആപ്ലിക്കേഷൻ ഡൌൺലോഡ് ചെയ്യുക, അത് ഇൻസ്റ്റാൾ ചെയ്ത് പ്രവർത്തിപ്പിക്കുക.
സ്ക്രീൻഷോട്ടുകൾ:
ഫീഡ്ബാക്കോടുകൂടിയ നിർദ്ദേശങ്ങൾ പാലിക്കുന്നു
വിവരണം:
മനുഷ്യ ഫീഡ്ബാക്കിലൂടെ ഉപയോക്തൃ നിർദ്ദേശങ്ങൾ മികച്ച രീതിയിൽ പിന്തുടരുന്ന പരിശീലന ഭാഷാ മോഡലുകളിലെ (InstructGPT മോഡലുകൾ) OpenAI-യുടെ പ്രവർത്തനത്തിന് അടിവരയിടുന്ന കോഡും അനുബന്ധ മെറ്റീരിയലുകളും following-instructions-human-feedback ശേഖരത്തിൽ അടങ്ങിയിരിക്കുന്നു. repo മോഡൽ കാർഡ്, സാമ്പിൾ ഓട്ടോമാറ്റിക് മൂല്യനിർണ്ണയ ഔട്ട്പുട്ടുകൾ, പ്രക്രിയയിൽ ഉപയോഗിക്കുന്ന ലേബലിംഗ് മാർഗ്ഗനിർദ്ദേശങ്ങൾ എന്നിവ ഹോസ്റ്റുചെയ്യുന്നു. "മനുഷ്യ ഫീഡ്ബാക്ക് ഉപയോഗിച്ച് നിർദ്ദേശങ്ങൾ പാലിക്കുന്നതിനുള്ള പരിശീലന ഭാഷാ മോഡലുകൾ" എന്ന പേപ്പറുമായി ഇത് വ്യക്തമായി ബന്ധപ്പെട്ടിരിക്കുന്നു, കൂടാതെ OpenAI എങ്ങനെ അനോട്ടേഷൻ മാർഗ്ഗനിർദ്ദേശങ്ങൾ ശേഖരിക്കുന്നു, മുൻഗണന താരതമ്യങ്ങൾ നടത്തുന്നു, മോഡൽ പെരുമാറ്റങ്ങൾ വിലയിരുത്തുന്നു എന്നതിന്റെ ഒരു റഫറൻസായി ഇത് പ്രവർത്തിക്കുന്നു. ശേഖരം മുഴുവൻ RLHF പൈപ്പ്ലൈനിന്റെയും പൂർണ്ണമായ നിർവ്വഹണമല്ല, മറിച്ച് പ്രസിദ്ധീകരിച്ച ഗവേഷണത്തെ പിന്തുണയ്ക്കുന്ന ഒരു ആർക്കൈവൽ ഹബ്ബാണ് - മൂല്യനിർണ്ണയത്തിനും മനുഷ്യ ലേബലിംഗ് മാനദണ്ഡങ്ങൾക്കും ചുറ്റുമുള്ള സുതാര്യത നൽകുന്നു. ഓട്ടോമാറ്റിക്-ഇവൽ-സാമ്പിളുകൾ (ബെഞ്ച്മാർക്ക് ടാസ്ക്കുകളിലെ മോഡൽ ഔട്ട്പുട്ടുകളുടെ സാമ്പിളുകൾ) പോലുള്ള ഡയറക്ടറികളും InstructGPT മോഡലുകളുടെ ഉദ്ദേശിച്ച പെരുമാറ്റം, പരിമിതികൾ, പക്ഷപാതങ്ങൾ എന്നിവ വിവരിക്കുന്ന ഒരു model-card.md-യും ഇതിൽ ഉൾപ്പെടുന്നു.
സവിശേഷതകൾ
- InstructGPT പരീക്ഷണങ്ങളിൽ നിന്നുള്ള മൂല്യനിർണ്ണയ സാമ്പിൾ ഔട്ട്പുട്ടുകളുടെ ആർക്കൈവ്.
- മോഡൽ ഉപയോഗം, പരിമിതികൾ, സുരക്ഷാ പരിഗണനകൾ എന്നിവ വിവരിക്കുന്ന model-card.md
- മനുഷ്യ മൂല്യനിർണ്ണയകർക്ക് ഉപയോഗിക്കുന്ന ലേബലിംഗ് മാർഗ്ഗനിർദ്ദേശങ്ങൾ / വ്യാഖ്യാന നിർദ്ദേശങ്ങൾ
- ബേസ്ലൈൻ vs ഫൈൻ-ട്യൂൺ ചെയ്ത ഔട്ട്പുട്ടുകൾ കാണിക്കുന്ന ഘടനാപരമായ "ഓട്ടോമാറ്റിക്-ഇവൽ-സാമ്പിളുകൾ" ഫോൾഡർ
- മോഡൽ മുൻഗണനാ റാങ്കിംഗും വിന്യാസവും OpenAI എങ്ങനെ അളക്കുന്നു എന്നതിനെക്കുറിച്ചുള്ള സുതാര്യത.
- യഥാർത്ഥ ഗവേഷണ പ്രബന്ധത്തിലേക്കും ഡോക്യുമെന്റേഷനിലേക്കുമുള്ള ലിങ്കുകളും റഫറൻസുകളും
Categories
ഇത് https://sourceforge.net/projects/following-inst-feedback.mirror/ എന്നതിൽ നിന്നും ലഭിക്കാവുന്ന ഒരു ആപ്ലിക്കേഷനാണ്. ഞങ്ങളുടെ സൗജന്യ ഓപ്പറേറ്റീവ് സിസ്റ്റങ്ങളിൽ ഒന്നിൽ നിന്ന് ഏറ്റവും എളുപ്പമുള്ള രീതിയിൽ ഓൺലൈനിൽ പ്രവർത്തിപ്പിക്കുന്നതിനായി ഇത് OnWorks-ൽ ഹോസ്റ്റ് ചെയ്തിരിക്കുന്നു.