ນີ້ແມ່ນແອັບ Linux ທີ່ມີຊື່ວ່າ DeepSeek-V3 ເຊິ່ງລຸ້ນຫຼ້າສຸດສາມາດດາວໂຫຼດໄດ້ເປັນ v1.0.0sourcecode.tar.gz. ມັນສາມາດດໍາເນີນການອອນໄລນ໌ຢູ່ໃນຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີ OnWorks ສໍາລັບສະຖານີບ່ອນເຮັດວຽກ.
ດາວນ໌ໂຫລດແລະດໍາເນີນການອອນໄລນ໌ app ນີ້ມີຊື່ DeepSeek-V3 ກັບ OnWorks ໄດ້ຟຣີ.
ປະຕິບັດຕາມຄໍາແນະນໍາເຫຼົ່ານີ້ເພື່ອດໍາເນີນການ app ນີ້:
- 1. ດາວໂຫຼດຄໍາຮ້ອງສະຫມັກນີ້ໃນ PC ຂອງທ່ານ.
- 2. ໃສ່ໃນຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 3. ອັບໂຫລດແອັບພລິເຄຊັນນີ້ຢູ່ໃນຕົວຈັດການໄຟລ໌ດັ່ງກ່າວ.
- 4. ເລີ່ມ OnWorks Linux ອອນລາຍ ຫຼື Windows online emulator ຫຼື MACOS online emulator ຈາກເວັບໄຊທ໌ນີ້.
- 5. ຈາກ OnWorks Linux OS ທີ່ເຈົ້າຫາກໍ່ເລີ່ມຕົ້ນ, ໄປທີ່ຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 6. ດາວນ໌ໂຫລດຄໍາຮ້ອງສະຫມັກ, ຕິດຕັ້ງມັນແລະດໍາເນີນການ.
ພາບຫນ້າຈໍ:
DeepSeek-V3
DESCRIPTION:
DeepSeek-V3 ເປັນຕົວແບບພາສາ Mixture-of-Experts (MoE) ທີ່ເຂັ້ມແຂງທີ່ພັດທະນາໂດຍ DeepSeek, ມີພາລາມິເຕີທັງໝົດ 671 ຕື້ພາລາມິເຕີ, ມີການເປີດໃຊ້ 37 ຕື້ຕໍ່ໂທເຄັນ. ມັນໃຊ້ Multi-head Latent Attention (MLA) ແລະສະຖາປັດຕະຍະກຳ DeepSeekMoE ເພື່ອເພີ່ມປະສິດທິພາບການຄິດໄລ່. ຮູບແບບດັ່ງກ່າວແນະນໍາຍຸດທະສາດການດຸ່ນດ່ຽງການໂຫຼດທີ່ບໍ່ເສຍຕົວຊ່ວຍ ແລະ ຈຸດປະສົງການຝຶກອົບຮົມການຄາດເດົາຫຼາຍໂທເຄັນເພື່ອເພີ່ມປະສິດທິພາບ. ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບ 14.8 ພັນຕື້ໂທເຄັນທີ່ຫຼາກຫຼາຍ, ຄຸນນະພາບສູງ, DeepSeek-V3 ໄດ້ຮັບການເບິ່ງແຍງກວດກາການປັບແຕ່ງແລະການເສີມສ້າງການຮຽນຮູ້ເພື່ອຮັບຮູ້ຄວາມສາມາດຂອງມັນຢ່າງເຕັມທີ່. ການປະເມີນຜົນຊີ້ໃຫ້ເຫັນວ່າມັນປະຕິບັດໄດ້ດີກວ່າແບບຈໍາລອງແຫຼ່ງເປີດອື່ນໆແລະຄູ່ແຂ່ງຊັ້ນນໍາຂອງແບບປິດແຫຼ່ງ, ບັນລຸເປົ້າຫມາຍນີ້ດ້ວຍໄລຍະເວລາການຝຶກອົບຮົມ 55 ມື້ໃນ 2,048 Nvidia H800 GPUs, ເຊິ່ງມີມູນຄ່າປະມານ 5.58 ລ້ານໂດລາ.
ຄຸນລັກສະນະ
- 671 ຕື້ພາລາມິເຕີທີ່ມີ 37 ຕື້ activated ຕໍ່ token, ຮັບປະກັນການສ້າງແບບຈໍາລອງພາສາທີ່ເຂັ້ມແຂງ.
- Multi-head Latent Attention (MLA) ແລະສະຖາປັດຕະຍະກຳ DeepSeekMoE ສຳລັບການຄຳນວນທີ່ມີປະສິດທິພາບ.
- ຍຸດທະສາດການດຸ່ນດ່ຽງການໂຫຼດທີ່ບໍ່ເສຍຕົວຊ່ວຍເສີມເພື່ອເພີ່ມປະສິດທິພາບໂດຍບໍ່ມີການສູນເສຍເພີ່ມເຕີມ.
- ຈຸດປະສົງການຝຶກອົບຮົມການຄາດເດົາຫຼາຍໂທເຄັນເພື່ອການປັບປຸງຄວາມສາມາດໃນການຄາດເດົາ.
- ການຝຶກອົບຮົມລ່ວງຫນ້າກ່ຽວກັບ 14.8 ພັນຕື້ tokens ຫຼາກຫຼາຍຊະນິດ, ຮັບປະກັນຄວາມເຂົ້າໃຈພາສາທີ່ສົມບູນແບບ.
- ການຊີ້ນຳການປັບແຕ່ງແລະການຮຽນຮູ້ເສີມສ້າງເພື່ອນຳໃຊ້ຄວາມສາມາດຕົວແບບຢ່າງເຕັມສ່ວນ.
- ປະຕິບັດໄດ້ດີກວ່າແບບຈໍາລອງແຫຼ່ງເປີດອື່ນໆ, ທຽບໄດ້ກັບຄູ່ຮ່ວມງານແຫຼ່ງປິດຊັ້ນນໍາ.
- ການຝຶກອົບຮົມທີ່ມີປະສິດທິພາບ, ສໍາເລັດໃນ 55 ມື້ໂດຍໃຊ້ 2,048 Nvidia H800 GPUs ຢູ່ທີ່ປະມານ 5.58 ລ້ານໂດລາ.
ພາສາການຂຽນໂປຣແກຣມ
Python
ປະເພດ
ນີ້ແມ່ນແອັບພລິເຄຊັນທີ່ຍັງສາມາດເອົາມາຈາກ https://sourceforge.net/projects/deepseek-v3.mirror/. ມັນໄດ້ຖືກຈັດຢູ່ໃນ OnWorks ເພື່ອໃຫ້ດໍາເນີນການອອນໄລນ໌ດ້ວຍວິທີທີ່ງ່າຍທີ່ສຸດຈາກຫນຶ່ງໃນລະບົບປະຕິບັດງານຟຣີຂອງພວກເຮົາ.