ນີ້ແມ່ນແອັບ Windows ທີ່ມີຊື່ວ່າ Ansj Chinese word segmentation ເຊິ່ງລຸ້ນຫຼ້າສຸດສາມາດດາວໂຫຼດໄດ້ໃນນາມ ansj_seg.zip. ມັນສາມາດດໍາເນີນການອອນໄລນ໌ຢູ່ໃນຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີ OnWorks ສໍາລັບສະຖານີເຮັດວຽກ.
ດາວນ໌ໂຫລດແລະດໍາເນີນການອອນໄລນ໌ app ນີ້ມີຊື່ Ansj ການແບ່ງສ່ວນຄໍາຈີນກັບ OnWorks ໄດ້ຟຣີ.
ປະຕິບັດຕາມຄໍາແນະນໍາເຫຼົ່ານີ້ເພື່ອດໍາເນີນການ app ນີ້:
- 1. ດາວໂຫຼດຄໍາຮ້ອງສະຫມັກນີ້ໃນ PC ຂອງທ່ານ.
- 2. ໃສ່ໃນຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 3. ອັບໂຫລດແອັບພລິເຄຊັນນີ້ຢູ່ໃນຕົວຈັດການໄຟລ໌ດັ່ງກ່າວ.
- 4. ເລີ່ມ emulator ອອນ ໄລ ນ ໌ OS OnWorks ຈາກ ເວັບ ໄຊ ທ ໌ ນີ້, ແຕ່ ດີກ ວ່າ Windows ອອນ ໄລ ນ ໌ emulator.
- 5. ຈາກ OnWorks Windows OS ທີ່ເຈົ້າຫາກໍ່ເລີ່ມຕົ້ນ, ໄປທີ່ຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 6. ດາວນ໌ໂຫລດຄໍາຮ້ອງສະຫມັກແລະຕິດຕັ້ງມັນ.
- 7. ດາວໂຫລດ Wine ຈາກບ່ອນເກັບມ້ຽນຊອບແວການແຈກຢາຍ Linux ຂອງທ່ານ. ເມື່ອຕິດຕັ້ງແລ້ວ, ທ່ານສາມາດຄລິກສອງຄັ້ງ app ເພື່ອດໍາເນີນການໃຫ້ເຂົາເຈົ້າກັບ Wine. ນອກນັ້ນທ່ານຍັງສາມາດລອງ PlayOnLinux, ການໂຕ້ຕອບທີ່ແປກປະຫຼາດໃນໄລຍະ Wine ທີ່ຈະຊ່ວຍໃຫ້ທ່ານຕິດຕັ້ງໂປລແກລມ Windows ແລະເກມທີ່ນິຍົມ.
ເຫຼົ້າແວງເປັນວິທີການແລ່ນຊອບແວ Windows ໃນ Linux, ແຕ່ບໍ່ມີ Windows ທີ່ຕ້ອງການ. ເຫຼົ້າແວງແມ່ນຊັ້ນຄວາມເຂົ້າກັນໄດ້ຂອງ Windows ແຫຼ່ງເປີດທີ່ສາມາດເອີ້ນໃຊ້ໂຄງການ Windows ໂດຍກົງໃນ desktop Linux ໃດກໍໄດ້. ໂດຍພື້ນຖານແລ້ວ, Wine ກໍາລັງພະຍາຍາມປະຕິບັດໃຫມ່ຢ່າງພຽງພໍຂອງ Windows ຕັ້ງແຕ່ເລີ່ມຕົ້ນເພື່ອໃຫ້ມັນສາມາດດໍາເນີນການຄໍາຮ້ອງສະຫມັກ Windows ທັງຫມົດໄດ້ໂດຍບໍ່ຕ້ອງໃຊ້ Windows.
ພາບຫນ້າຈໍ:
ການແບ່ງສ່ວນຄໍາສັບພາສາຈີນ Ansj
DESCRIPTION:
ການປະຕິບັດ java ທີ່ແທ້ຈິງຂອງ ict. ຜົນກະທົບການແບ່ງສ່ວນຂອງຄໍາສັບແມ່ນໄວກວ່າສະບັບ open source ຂອງ ict. ການແບ່ງສ່ວນຄໍາສັບຂອງຈີນ, ການຮັບຮູ້ຊື່, tagging ສ່ວນຂອງການປາກເວົ້າ, ວັດຈະນານຸກົມທີ່ຜູ້ໃຊ້ກໍານົດ. ນີ້ແມ່ນການປະຕິບັດ java ຂອງການແບ່ງສ່ວນຄໍາສັບພາສາຈີນໂດຍອີງໃສ່ n-Gram + CRF + HMM. ຄວາມໄວການແບ່ງສ່ວນຄໍາສັບບັນລຸປະມານ 2 ລ້ານຄໍາຕໍ່ວິນາທີ (ທົດສອບພາຍໃຕ້ mac air), ແລະອັດຕາຄວາມຖືກຕ້ອງສາມາດບັນລຸຫຼາຍກ່ວາ 96%. ໃນປັດຈຸບັນ, ມັນໄດ້ຮັບຮູ້ເຖິງຫນ້າທີ່ຂອງການແບ່ງສ່ວນຄໍາສັບພາສາຈີນ, ການຮັບຮູ້ຊື່ຂອງຈີນ, ວັດຈະນານຸກົມທີ່ຜູ້ໃຊ້ກໍານົດ, ການສະກັດເອົາຄໍາສໍາຄັນ, ການສະຫຼຸບອັດຕະໂນມັດແລະການຕິດຄໍາສໍາຄັນ. ມັນສາມາດຖືກນໍາໃຊ້ກັບການປຸງແຕ່ງພາສາທໍາມະຊາດແລະລັກສະນະອື່ນໆ, ແລະເຫມາະສົມກັບໂຄງການຕ່າງໆທີ່ຕ້ອງການຜົນກະທົບການແບ່ງສ່ວນຄໍາທີ່ສູງ.
ຄຸນລັກສະນະ
- ອີງໃສ່ n-Gram+CRF+HMM
- ການປະຕິບັດ Java ຂອງການແບ່ງປັນຄໍາຈີນ
- ການຮັບຮູ້ຊື່ພາສາຈີນ, ວັດຈະນານຸກົມທີ່ຜູ້ໃຊ້ກໍານົດ, ການສະກັດເອົາຄໍາຫລັກ
- ການສະຫຼຸບອັດຕະໂນມັດ, ແລະການແທັກຄໍາສໍາຄັນ
- ສາມາດນໍາໃຊ້ກັບການປຸງແຕ່ງພາສາທໍາມະຊາດ
- ເຫມາະສໍາລັບໂຄງການທີ່ຕ້ອງການຜົນກະທົບການແບ່ງສ່ວນຄໍາທີ່ສູງ
ພາສາການຂຽນໂປຣແກຣມ
Java
ນີ້ແມ່ນແອັບພລິເຄຊັນທີ່ຍັງສາມາດເອົາມາຈາກ https://sourceforge.net/projects/ansj-seg.mirror/. ມັນໄດ້ຖືກຈັດຢູ່ໃນ OnWorks ເພື່ອໃຫ້ດໍາເນີນການອອນໄລນ໌ໃນວິທີທີ່ງ່າຍທີ່ສຸດຈາກຫນຶ່ງໃນລະບົບປະຕິບັດງານຟຣີຂອງພວກເຮົາ.