DeepSeek-V3 എന്ന് പേരിട്ടിരിക്കുന്ന Linux ആപ്പാണിത്, ഇതിന്റെ ഏറ്റവും പുതിയ പതിപ്പ് v1.0.0sourcecode.tar.gz ആയി ഡൗൺലോഡ് ചെയ്യാം. വർക്ക്സ്റ്റേഷനുകൾക്കായുള്ള സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവായ OnWorks-ൽ ഇത് ഓൺലൈനായി പ്രവർത്തിപ്പിക്കാം.
DeepSeek-V3 എന്ന് പേരിട്ടിരിക്കുന്ന ഈ ആപ്പ് OnWorks-നൊപ്പം സൗജന്യമായി ഓൺലൈനായി ഡൗൺലോഡ് ചെയ്ത് പ്രവർത്തിപ്പിക്കുക.
ഈ ആപ്പ് പ്രവർത്തിപ്പിക്കുന്നതിന് ഈ നിർദ്ദേശങ്ങൾ പാലിക്കുക:
- 1. നിങ്ങളുടെ പിസിയിൽ ഈ ആപ്ലിക്കേഷൻ ഡൗൺലോഡ് ചെയ്തു.
- 2. ഞങ്ങളുടെ ഫയൽ മാനേജറിൽ https://www.onworks.net/myfiles.php?username=XXXXX എന്നതിൽ നിങ്ങൾക്ക് ആവശ്യമുള്ള ഉപയോക്തൃനാമം നൽകുക.
- 3. അത്തരം ഫയൽമാനേജറിൽ ഈ ആപ്ലിക്കേഷൻ അപ്ലോഡ് ചെയ്യുക.
- 4. ഈ വെബ്സൈറ്റിൽ നിന്ന് OnWorks Linux ഓൺലൈനോ Windows ഓൺലൈൻ എമുലേറ്ററോ MACOS ഓൺലൈൻ എമുലേറ്ററോ ആരംഭിക്കുക.
- 5. നിങ്ങൾ ഇപ്പോൾ ആരംഭിച്ച OnWorks Linux OS-ൽ നിന്ന്, നിങ്ങൾക്ക് ആവശ്യമുള്ള ഉപയോക്തൃനാമത്തോടുകൂടിയ ഞങ്ങളുടെ ഫയൽ മാനേജർ https://www.onworks.net/myfiles.php?username=XXXXX എന്നതിലേക്ക് പോകുക.
- 6. ആപ്ലിക്കേഷൻ ഡൌൺലോഡ് ചെയ്യുക, അത് ഇൻസ്റ്റാൾ ചെയ്ത് പ്രവർത്തിപ്പിക്കുക.
സ്ക്രീൻഷോട്ടുകൾ:
DeepSeek-V3
വിവരണം:
DeepSeek വികസിപ്പിച്ചെടുത്ത ഒരു ശക്തമായ മിക്സ്ചർ-ഓഫ്-എക്സ്പർട്ട്സ് (MoE) ഭാഷാ മോഡലാണ് DeepSeek-V3, ഇതിൽ ആകെ 671 ബില്യൺ പാരാമീറ്ററുകൾ ഉൾപ്പെടുന്നു, ഓരോ ടോക്കണിലും 37 ബില്യൺ സജീവമാക്കിയിരിക്കുന്നു. കമ്പ്യൂട്ടേഷണൽ കാര്യക്ഷമത വർദ്ധിപ്പിക്കുന്നതിന് ഇത് മൾട്ടി-ഹെഡ് ലാറ്റന്റ് അറ്റൻഷൻ (MLA) ഉം DeepSeekMoE ആർക്കിടെക്ചറും ഉപയോഗിക്കുന്നു. പ്രകടനം വർദ്ധിപ്പിക്കുന്നതിന് ഒരു ഓക്സിലറി-ലോസ്-ഫ്രീ ലോഡ് ബാലൻസിംഗ് തന്ത്രവും മൾട്ടി-ടോക്കൺ പ്രവചന പരിശീലന ലക്ഷ്യവും ഈ മോഡൽ അവതരിപ്പിക്കുന്നു. 14.8 ട്രില്യൺ വൈവിധ്യമാർന്ന, ഉയർന്ന നിലവാരമുള്ള ടോക്കണുകളിൽ പരിശീലനം നേടിയ DeepSeek-V3, അതിന്റെ കഴിവുകൾ പൂർണ്ണമായി മനസ്സിലാക്കുന്നതിനായി മേൽനോട്ടത്തിലുള്ള ഫൈൻ-ട്യൂണിംഗും ബലപ്പെടുത്തൽ പഠനവും നടത്തി. മറ്റ് ഓപ്പൺ സോഴ്സ് മോഡലുകളെയും എതിരാളികളെയും ഇത് മറികടക്കുന്നുവെന്ന് വിലയിരുത്തലുകൾ സൂചിപ്പിക്കുന്നു, ക്ലോസ്ഡ് സോഴ്സ് മോഡലുകളെ നയിക്കുന്നു, ഏകദേശം $55 ദശലക്ഷം ചിലവ് വരുന്ന 2,048 Nvidia H800 GPU-കളിൽ 5.58 ദിവസത്തെ പരിശീലന കാലയളവിലൂടെ ഇത് നേടുന്നു.
സവിശേഷതകൾ
- 671 ബില്യൺ പാരാമീറ്ററുകൾ, ഓരോ ടോക്കണിലും 37 ബില്യൺ സജീവമാക്കി, ശക്തമായ ഭാഷാ മോഡലിംഗ് ഉറപ്പാക്കുന്നു.
- കാര്യക്ഷമമായ കമ്പ്യൂട്ടേഷനായി മൾട്ടി-ഹെഡ് ലാറ്റന്റ് അറ്റൻഷൻ (എംഎൽഎ), ഡീപ്സീക്ക്എംഒഇ ആർക്കിടെക്ചർ.
- അധിക നഷ്ടങ്ങളില്ലാതെ പ്രകടനം മെച്ചപ്പെടുത്തുന്നതിനുള്ള സഹായ-നഷ്ടരഹിത ലോഡ് ബാലൻസിംഗ് തന്ത്രം.
- പ്രവചന ശേഷി മെച്ചപ്പെടുത്തുന്നതിനുള്ള മൾട്ടി-ടോക്കൺ പ്രവചന പരിശീലന ലക്ഷ്യം.
- 14.8 ട്രില്യൺ വൈവിധ്യമാർന്ന ടോക്കണുകളിൽ മുൻകൂട്ടി പരിശീലനം നേടി, സമഗ്രമായ ഭാഷാ ധാരണ ഉറപ്പാക്കുന്നു.
- മോഡൽ സാധ്യതകൾ പൂർണ്ണമായും പ്രയോജനപ്പെടുത്തുന്നതിന് മേൽനോട്ടത്തിലുള്ള ഫൈൻ-ട്യൂണിംഗും ബലപ്പെടുത്തൽ പഠനവും.
- മുൻനിര ക്ലോസ്ഡ് സോഴ്സ് എതിരാളികളുമായി താരതമ്യപ്പെടുത്താവുന്ന മറ്റ് ഓപ്പൺ സോഴ്സ് മോഡലുകളെ മറികടക്കുന്നു.
- 55 Nvidia H2,048 GPU-കൾ ഉപയോഗിച്ച് ഏകദേശം $800 മില്യൺ ചിലവിൽ 5.58 ദിവസത്തിനുള്ളിൽ പൂർത്തിയാക്കിയ ചെലവ് കുറഞ്ഞ പരിശീലനം.
പ്രോഗ്രാമിംഗ് ഭാഷ
പൈത്തൺ
Categories
ഇത് https://sourceforge.net/projects/deepseek-v3.mirror/ എന്നതിൽ നിന്നും ലഭിക്കാവുന്ന ഒരു ആപ്ലിക്കേഷനാണ്. ഞങ്ങളുടെ സൗജന്യ ഓപ്പറേറ്റീവ് സിസ്റ്റങ്ങളിൽ ഒന്നിൽ നിന്ന് ഏറ്റവും എളുപ്പമുള്ള രീതിയിൽ ഓൺലൈനിൽ പ്രവർത്തിപ്പിക്കുന്നതിനായി ഇത് OnWorks-ൽ ഹോസ്റ്റ് ചെയ്തിരിക്കുന്നു.