ດາວໂຫຼດ DeepSeek-V3 ສໍາລັບ Linux

ນີ້ແມ່ນແອັບ Linux ທີ່ມີຊື່ວ່າ DeepSeek-V3 ເຊິ່ງລຸ້ນຫຼ້າສຸດສາມາດດາວໂຫຼດໄດ້ເປັນ v1.0.0sourcecode.tar.gz. ມັນສາມາດດໍາເນີນການອອນໄລນ໌ຢູ່ໃນຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີ OnWorks ສໍາລັບສະຖານີບ່ອນເຮັດວຽກ.

 
 

ດາວ​ນ​໌​ໂຫລດ​ແລະ​ດໍາ​ເນີນ​ການ​ອອນ​ໄລ​ນ​໌ app ນີ້​ມີ​ຊື່ DeepSeek-V3 ກັບ OnWorks ໄດ້​ຟຣີ​.

ປະຕິບັດຕາມຄໍາແນະນໍາເຫຼົ່ານີ້ເພື່ອດໍາເນີນການ app ນີ້:

- 1. ດາວ​ໂຫຼດ​ຄໍາ​ຮ້ອງ​ສະ​ຫມັກ​ນີ້​ໃນ PC ຂອງ​ທ່ານ​.

- 2. ໃສ່ໃນຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.

- 3. ອັບໂຫລດແອັບພລິເຄຊັນນີ້ຢູ່ໃນຕົວຈັດການໄຟລ໌ດັ່ງກ່າວ.

- 4. ເລີ່ມ OnWorks Linux ອອນລາຍ ຫຼື Windows online emulator ຫຼື MACOS online emulator ຈາກເວັບໄຊທ໌ນີ້.

- 5. ຈາກ OnWorks Linux OS ທີ່ເຈົ້າຫາກໍ່ເລີ່ມຕົ້ນ, ໄປທີ່ຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.

- 6. ດາວນ໌ໂຫລດຄໍາຮ້ອງສະຫມັກ, ຕິດຕັ້ງມັນແລະດໍາເນີນການ.

ພາບຫນ້າຈໍ:


DeepSeek-V3


DESCRIPTION:

DeepSeek-V3 ເປັນຕົວແບບພາສາ Mixture-of-Experts (MoE) ທີ່ເຂັ້ມແຂງທີ່ພັດທະນາໂດຍ DeepSeek, ມີພາລາມິເຕີທັງໝົດ 671 ຕື້ພາລາມິເຕີ, ມີການເປີດໃຊ້ 37 ຕື້ຕໍ່ໂທເຄັນ. ມັນໃຊ້ Multi-head Latent Attention (MLA) ແລະສະຖາປັດຕະຍະກຳ DeepSeekMoE ເພື່ອເພີ່ມປະສິດທິພາບການຄິດໄລ່. ຮູບແບບດັ່ງກ່າວແນະນໍາຍຸດທະສາດການດຸ່ນດ່ຽງການໂຫຼດທີ່ບໍ່ເສຍຕົວຊ່ວຍ ແລະ ຈຸດປະສົງການຝຶກອົບຮົມການຄາດເດົາຫຼາຍໂທເຄັນເພື່ອເພີ່ມປະສິດທິພາບ. ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບ 14.8 ພັນຕື້ໂທເຄັນທີ່ຫຼາກຫຼາຍ, ຄຸນນະພາບສູງ, DeepSeek-V3 ໄດ້ຮັບການເບິ່ງແຍງກວດກາການປັບແຕ່ງແລະການເສີມສ້າງການຮຽນຮູ້ເພື່ອຮັບຮູ້ຄວາມສາມາດຂອງມັນຢ່າງເຕັມທີ່. ການປະເມີນຜົນຊີ້ໃຫ້ເຫັນວ່າມັນປະຕິບັດໄດ້ດີກວ່າແບບຈໍາລອງແຫຼ່ງເປີດອື່ນໆແລະຄູ່ແຂ່ງຊັ້ນນໍາຂອງແບບປິດແຫຼ່ງ, ບັນລຸເປົ້າຫມາຍນີ້ດ້ວຍໄລຍະເວລາການຝຶກອົບຮົມ 55 ມື້ໃນ 2,048 Nvidia H800 GPUs, ເຊິ່ງມີມູນຄ່າປະມານ 5.58 ລ້ານໂດລາ.



ຄຸນ​ລັກ​ສະ​ນະ

  • 671 ຕື້ພາລາມິເຕີທີ່ມີ 37 ຕື້ activated ຕໍ່ token, ຮັບປະກັນການສ້າງແບບຈໍາລອງພາສາທີ່ເຂັ້ມແຂງ.
  • Multi-head Latent Attention (MLA) ແລະສະຖາປັດຕະຍະກຳ DeepSeekMoE ສຳລັບການຄຳນວນທີ່ມີປະສິດທິພາບ.
  • ຍຸດທະສາດການດຸ່ນດ່ຽງການໂຫຼດທີ່ບໍ່ເສຍຕົວຊ່ວຍເສີມເພື່ອເພີ່ມປະສິດທິພາບໂດຍບໍ່ມີການສູນເສຍເພີ່ມເຕີມ.
  • ຈຸດປະສົງການຝຶກອົບຮົມການຄາດເດົາຫຼາຍໂທເຄັນເພື່ອການປັບປຸງຄວາມສາມາດໃນການຄາດເດົາ.
  • ການຝຶກອົບຮົມລ່ວງຫນ້າກ່ຽວກັບ 14.8 ພັນຕື້ tokens ຫຼາກຫຼາຍຊະນິດ, ຮັບປະກັນຄວາມເຂົ້າໃຈພາສາທີ່ສົມບູນແບບ.
  • ການ​ຊີ້​ນຳ​ການ​ປັບ​ແຕ່ງ​ແລະ​ການ​ຮຽນ​ຮູ້​ເສີມ​ສ້າງ​ເພື່ອ​ນຳ​ໃຊ້​ຄວາມ​ສາ​ມາດ​ຕົວ​ແບບ​ຢ່າງ​ເຕັມ​ສ່ວນ.
  • ປະຕິບັດໄດ້ດີກວ່າແບບຈໍາລອງແຫຼ່ງເປີດອື່ນໆ, ທຽບໄດ້ກັບຄູ່ຮ່ວມງານແຫຼ່ງປິດຊັ້ນນໍາ.
  • ການຝຶກອົບຮົມທີ່ມີປະສິດທິພາບ, ສໍາເລັດໃນ 55 ມື້ໂດຍໃຊ້ 2,048 Nvidia H800 GPUs ຢູ່ທີ່ປະມານ 5.58 ລ້ານໂດລາ.


ພາສາການຂຽນໂປຣແກຣມ

Python


ປະເພດ

ຕົວແບບພາສາຂະຫນາດໃຫຍ່ (LLM), ກອບການຮຽນຮູ້ການເສີມສ້າງ, ຮູບແບບ AI

ນີ້ແມ່ນແອັບພລິເຄຊັນທີ່ຍັງສາມາດເອົາມາຈາກ https://sourceforge.net/projects/deepseek-v3.mirror/. ມັນໄດ້ຖືກຈັດຢູ່ໃນ OnWorks ເພື່ອໃຫ້ດໍາເນີນການອອນໄລນ໌ດ້ວຍວິທີທີ່ງ່າຍທີ່ສຸດຈາກຫນຶ່ງໃນລະບົບປະຕິບັດງານຟຣີຂອງພວກເຮົາ.



ລ່າສຸດ Linux ແລະ Windows ໂຄງການອອນໄລນ໌


ໝວດໝູ່ເພື່ອດາວໂຫລດຊອບແວ ແລະໂປຣແກຣມສຳລັບ Windows ແລະ Linux