This is the Linux app named Following Instructions with Feedback whose latest release can be downloaded as following-instructions-human-feedbacksourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
OnWorks-നൊപ്പം ഫീഡ്ബാക്ക് ഉപയോഗിച്ച് പിന്തുടരൽ നിർദ്ദേശങ്ങൾ എന്ന് പേരിട്ടിരിക്കുന്ന ഈ ആപ്പ് സൗജന്യമായി ഓൺലൈനായി ഡൗൺലോഡ് ചെയ്ത് പ്രവർത്തിപ്പിക്കുക.
ഈ ആപ്പ് പ്രവർത്തിപ്പിക്കുന്നതിന് ഈ നിർദ്ദേശങ്ങൾ പാലിക്കുക:
- 1. നിങ്ങളുടെ പിസിയിൽ ഈ ആപ്ലിക്കേഷൻ ഡൗൺലോഡ് ചെയ്തു.
- 2. ഞങ്ങളുടെ ഫയൽ മാനേജറിൽ https://www.onworks.net/myfiles.php?username=XXXXX എന്നതിൽ നിങ്ങൾക്ക് ആവശ്യമുള്ള ഉപയോക്തൃനാമം നൽകുക.
- 3. അത്തരം ഫയൽമാനേജറിൽ ഈ ആപ്ലിക്കേഷൻ അപ്ലോഡ് ചെയ്യുക.
- 4. ഈ വെബ്സൈറ്റിൽ നിന്ന് OnWorks Linux ഓൺലൈനോ Windows ഓൺലൈൻ എമുലേറ്ററോ MACOS ഓൺലൈൻ എമുലേറ്ററോ ആരംഭിക്കുക.
- 5. നിങ്ങൾ ഇപ്പോൾ ആരംഭിച്ച OnWorks Linux OS-ൽ നിന്ന്, നിങ്ങൾക്ക് ആവശ്യമുള്ള ഉപയോക്തൃനാമത്തോടുകൂടിയ ഞങ്ങളുടെ ഫയൽ മാനേജർ https://www.onworks.net/myfiles.php?username=XXXXX എന്നതിലേക്ക് പോകുക.
- 6. ആപ്ലിക്കേഷൻ ഡൌൺലോഡ് ചെയ്യുക, അത് ഇൻസ്റ്റാൾ ചെയ്ത് പ്രവർത്തിപ്പിക്കുക.
സ്ക്രീൻഷോട്ടുകൾ
Ad
ഫീഡ്ബാക്കോടുകൂടിയ നിർദ്ദേശങ്ങൾ പാലിക്കുന്നു
വിവരണം
മനുഷ്യ ഫീഡ്ബാക്കിലൂടെ ഉപയോക്തൃ നിർദ്ദേശങ്ങൾ മികച്ച രീതിയിൽ പിന്തുടരുന്ന പരിശീലന ഭാഷാ മോഡലുകളിലെ (InstructGPT മോഡലുകൾ) OpenAI-യുടെ പ്രവർത്തനത്തിന് അടിവരയിടുന്ന കോഡും അനുബന്ധ മെറ്റീരിയലുകളും following-instructions-human-feedback ശേഖരത്തിൽ അടങ്ങിയിരിക്കുന്നു. repo മോഡൽ കാർഡ്, സാമ്പിൾ ഓട്ടോമാറ്റിക് മൂല്യനിർണ്ണയ ഔട്ട്പുട്ടുകൾ, പ്രക്രിയയിൽ ഉപയോഗിക്കുന്ന ലേബലിംഗ് മാർഗ്ഗനിർദ്ദേശങ്ങൾ എന്നിവ ഹോസ്റ്റുചെയ്യുന്നു. "മനുഷ്യ ഫീഡ്ബാക്ക് ഉപയോഗിച്ച് നിർദ്ദേശങ്ങൾ പാലിക്കുന്നതിനുള്ള പരിശീലന ഭാഷാ മോഡലുകൾ" എന്ന പേപ്പറുമായി ഇത് വ്യക്തമായി ബന്ധപ്പെട്ടിരിക്കുന്നു, കൂടാതെ OpenAI എങ്ങനെ അനോട്ടേഷൻ മാർഗ്ഗനിർദ്ദേശങ്ങൾ ശേഖരിക്കുന്നു, മുൻഗണന താരതമ്യങ്ങൾ നടത്തുന്നു, മോഡൽ പെരുമാറ്റങ്ങൾ വിലയിരുത്തുന്നു എന്നതിന്റെ ഒരു റഫറൻസായി ഇത് പ്രവർത്തിക്കുന്നു. ശേഖരം മുഴുവൻ RLHF പൈപ്പ്ലൈനിന്റെയും പൂർണ്ണമായ നിർവ്വഹണമല്ല, മറിച്ച് പ്രസിദ്ധീകരിച്ച ഗവേഷണത്തെ പിന്തുണയ്ക്കുന്ന ഒരു ആർക്കൈവൽ ഹബ്ബാണ് - മൂല്യനിർണ്ണയത്തിനും മനുഷ്യ ലേബലിംഗ് മാനദണ്ഡങ്ങൾക്കും ചുറ്റുമുള്ള സുതാര്യത നൽകുന്നു. ഓട്ടോമാറ്റിക്-ഇവൽ-സാമ്പിളുകൾ (ബെഞ്ച്മാർക്ക് ടാസ്ക്കുകളിലെ മോഡൽ ഔട്ട്പുട്ടുകളുടെ സാമ്പിളുകൾ) പോലുള്ള ഡയറക്ടറികളും InstructGPT മോഡലുകളുടെ ഉദ്ദേശിച്ച പെരുമാറ്റം, പരിമിതികൾ, പക്ഷപാതങ്ങൾ എന്നിവ വിവരിക്കുന്ന ഒരു model-card.md-യും ഇതിൽ ഉൾപ്പെടുന്നു.
സവിശേഷതകൾ
- InstructGPT പരീക്ഷണങ്ങളിൽ നിന്നുള്ള മൂല്യനിർണ്ണയ സാമ്പിൾ ഔട്ട്പുട്ടുകളുടെ ആർക്കൈവ്.
- മോഡൽ ഉപയോഗം, പരിമിതികൾ, സുരക്ഷാ പരിഗണനകൾ എന്നിവ വിവരിക്കുന്ന model-card.md
- മനുഷ്യ മൂല്യനിർണ്ണയകർക്ക് ഉപയോഗിക്കുന്ന ലേബലിംഗ് മാർഗ്ഗനിർദ്ദേശങ്ങൾ / വ്യാഖ്യാന നിർദ്ദേശങ്ങൾ
- ബേസ്ലൈൻ vs ഫൈൻ-ട്യൂൺ ചെയ്ത ഔട്ട്പുട്ടുകൾ കാണിക്കുന്ന ഘടനാപരമായ "ഓട്ടോമാറ്റിക്-ഇവൽ-സാമ്പിളുകൾ" ഫോൾഡർ
- മോഡൽ മുൻഗണനാ റാങ്കിംഗും വിന്യാസവും OpenAI എങ്ങനെ അളക്കുന്നു എന്നതിനെക്കുറിച്ചുള്ള സുതാര്യത.
- യഥാർത്ഥ ഗവേഷണ പ്രബന്ധത്തിലേക്കും ഡോക്യുമെന്റേഷനിലേക്കുമുള്ള ലിങ്കുകളും റഫറൻസുകളും
Categories
ഇത് https://sourceforge.net/projects/following-inst-feedback.mirror/ എന്നതിൽ നിന്നും ലഭിക്കാവുന്ന ഒരു ആപ്ലിക്കേഷനാണ്. ഞങ്ങളുടെ സൗജന്യ ഓപ്പറേറ്റീവ് സിസ്റ്റങ്ങളിൽ ഒന്നിൽ നിന്ന് ഏറ്റവും എളുപ്പമുള്ള രീതിയിൽ ഓൺലൈനിൽ പ്രവർത്തിപ്പിക്കുന്നതിനായി ഇത് OnWorks-ൽ ഹോസ്റ്റ് ചെയ്തിരിക്കുന്നു.
