ນີ້ແມ່ນຄໍາສັ່ງ mmseg ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
mmseg - ສ່ວນທີ່ກົງກັນສູງສຸດຂອງຂໍ້ຄວາມພາສາຈີນ.
ສະຫຼຸບສັງລວມ
mmseg -d dict_file [ທາງເລືອກ]... [corpus_file] ...
ລາຍລະອຽດ
mmseg ເປັນເຄື່ອງມືສໍາລັບການແບ່ງປັນຕົວຫນັງສືຈີນເປັນຄໍາສັບຕ່າງໆໂດຍນໍາໃຊ້ຂັ້ນຕອນການຈັບຄູ່ສູງສຸດ.
mmseg ສ່ວນ corpus_file, ຫຼືມາດຕະຖານການປ້ອນຂໍ້ມູນຖ້າບໍ່ມີຊື່ໄຟລ໌ຖືກລະບຸ, ແລະຂຽນ
ແບ່ງສ່ວນຜົນໄດ້ຮັບໄປຫາຜົນຜະລິດມາດຕະຖານ.
OPTIONS
-d dict_file
ການນໍາໃຊ້ dict_file ເປັນ lexicon. ສາມາດພົບເຫັນບັນນາທິການເລີ່ມຕົ້ນທີ່
/usr/share/sunpinyin-slm/dict.utf8.
-f,-- ຮູບແບບ (ຂໍ້ຄວາມ|ເຈົ້າ)
ຮູບແບບຜົນຜະລິດ, ສາມາດເປັນ 'ຂໍ້ຄວາມ' ຫຼື 'bin'. 'bin' ເລີ່ມຕົ້ນ. ໂດຍປົກກະຕິ, ໃນຮູບແບບຂໍ້ຄວາມ, ຄໍາ
ຂໍ້ຄວາມແມ່ນຜົນຜະລິດ, ໃນຂະນະທີ່ຢູ່ໃນຮູບແບບຄູ່, ເລກທົດແທນສັ້ນຂອງຄໍາ-ids ແມ່ນ
ຂຽນໃສ່ stdout.
-s, --ສະຕັອກ STOK_ID
ID token ປະໂຫຍກ. Default 10. ມັນຈະໄດ້ຮັບການລາຍລັກອັກສອນໃຫ້ອອກໃນຮູບແບບສອງຫຼັງຈາກນັ້ນ
ທຸກໆປະໂຫຍກ.
-i, --show-id
ສະແດງຂໍ້ມູນ ID. ພາຍໃຕ້ຮູບແບບຮູບແບບຜົນຜະລິດຂໍ້ຄວາມ, ຕິດ ID ຫຼັງຈາກຄໍາສັບຕ່າງໆທີ່ຮູ້ຈັກ. ຖ້າພາຍໃຕ້
ຮູບແບບຖານສອງ, ພິມ ID(s) ໃນຂໍ້ຄວາມ.
-a, --ambiguious-id AMBI-ID
ຫມາຍຄວາມວ່າບໍ່ຊັດເຈນ ABC => A BC or AB C. ຖ້າລະບຸ (AMBI-ID != 0), ລຳດັບ ABC
ຈະບໍ່ຖືກແບ່ງແຍກ, ໃນໂຫມດຖານສອງ, the AMBI-ID ຖືກຂຽນອອກ; ໃນຮູບແບບຂໍ້ຄວາມ,
" ABC " ຈະເປັນຜົນຜະລິດ. ຄ່າເລີ່ມຕົ້ນແມ່ນ 0.
ຫມາຍເຫດ
ພາຍໃຕ້ການ binary ໂຫມດ, id ຕິດຕໍ່ກັນຂອງ 0 ຖືກລວມເຂົ້າໄປໃນຫນຶ່ງ 0. ພາຍໃຕ້ ຂໍ້ຄວາມ ຮູບແບບ, ບໍ່ມີພື້ນທີ່
ຖືກໃສ່ລະຫວ່າງຄໍາທີ່ບໍ່ຮູ້ຈັກ.
ໃຊ້ mmseg ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net