ນີ້ແມ່ນຄໍາສັ່ງ langidentp ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
langident - ກໍານົດໄຟລ໌ພາສາທີ່ຖືກຂຽນໄວ້ໃນ
ສະຫຼຸບສັງລວມ
langident [ຕົວເລືອກ] file1 [file2 ...]
ລາຍລະອຽດ
ລະບຸໄຟລ໌ພາສາທີ່ຂຽນໂດຍໃຊ້ Perl module Lingua::Identify.
OPTIONS
-a
ສະແດງຜົນການຄົ້ນຫາທັງໝົດ (ບໍ່ພຽງແຕ່ເປັນພາສາທີ່ອາດຈະເປັນໄປໄດ້ທີ່ສຸດ).
-c
ສະແດງລະດັບຄວາມໝັ້ນໃຈສຳລັບພາສາທີ່ເປັນໄປໄດ້ທີ່ສຸດ (ມັນຈະເປັນຄ່າທຳອິດໃນທັນທີ
ພາສາທີ່ເປັນໄປໄດ້ຫຼາຍທີ່ສຸດ).
-d
Debug (ການພັດທະນາເທົ່ານັ້ນ).
-E ກຳລັງເຂົ້າລະຫັດ
ເລືອກການເຂົ້າລະຫັດການປ້ອນຂໍ້ມູນ. ຄ່າເລີ່ມຕົ້ນເປັນ UTF-8.
# ໃຊ້ ISO-8859-1 (ລາຕິນ 1)
ໄຟລ໌ langident -E ISO-8859-1
-e ວິທີການ
ເລືອກວິທີການທີ່ຈະໃຊ້. ມີສາມວິທີຂອງການດໍາເນີນການນີ້:
# ພຽງແຕ່ນໍາໃຊ້ວິທີການ
ໄຟລ໌ langident -e ngrams3
# ໃຊ້ຫຼາຍວິທີ (ແຍກພວກມັນດ້ວຍເຄື່ອງໝາຍຈຸດ)
langident -e prefixes3,suffixes3
# ໃຊ້ຫຼາຍວິທີແລະກໍານົດນ້ໍາຫນັກທີ່ແຕກຕ່າງກັນໃຫ້ກັບແຕ່ລະຄົນ
langident -e smallwords=2,prefixes=1,ngrams3=1.3
ວິທີການທີ່ມີຢູ່ດັ່ງຕໍ່ໄປນີ້: ຄໍານ້ອຍໆ, ຄຳນຳໜ້າ1, ຄຳນຳໜ້າ2, ຄຳນຳໜ້າ3,
ຄຳນຳໜ້າ4, ຄຳຕໍ່ທ້າຍ1, ຄຳຕໍ່ທ້າຍ2, ຄຳຕໍ່ທ້າຍ3, ຄຳຕໍ່ທ້າຍ4, ງາມ1, ງາມ2, ງາມ3 ແລະ
ງາມ4.
-h
ສະແດງຂໍ້ຄວາມຊ່ວຍເຫຼືອ ແລະອອກ.
-l
ບອກພາສາທີ່ມີຢູ່ທັງໝົດ ແລະອອກ.
-m NUMBER
ກໍານົດຈໍານວນສູງສຸດຂອງຜົນໄດ້ຮັບ (ພາສາ) ທີ່ຈະສະແດງ (ສະແດງໃຫ້ເຫັນ N ພາສາທີ່ເປັນໄປໄດ້ຫຼາຍທີ່ສຸດ,
ໂດຍຂັ້ນລຸ່ມຂອງຄວາມເປັນໄປໄດ້).
overrides -a ສະວິດ.
-o LANGUAGES
ພຽງແຕ່ເຮັດວຽກກັບພາສາທີ່ລະບຸ.
# ລະບຸລະຫວ່າງພາສາປອກຕຸຍການແລະພາສາອັງກິດເທົ່ານັ້ນ
langident -o pt,en *
-p
ຍັງສະແດງອັດຕາສ່ວນ.
-s ຫລືຂະຫຍາຍໂຕ
ຂະໜາດສູງສຸດເພື່ອກວດກາ.
-v
ສະແດງສະບັບແລະອອກ.
ຕົວຢ່າງ
ໃຊ້ວິທີການ ngms2 ແລະ ngms1, ກໍານົດສອງຄວາມສໍາຄັນຂອງ ngms2 (-e
ສະຫຼັບ); ຜົນຜະລິດຈະປະກອບມີສາມພາສາທີ່ເປັນໄປໄດ້ທີ່ສຸດ (-m switch) ກັບຂອງມັນ
ເປີເຊັນ (-p switch) ແລະຍັງລະດັບຄວາມຫມັ້ນໃຈ (-c switch) ຂອງຜົນໄດ້ຮັບທໍາອິດ.
$ langident -e ngrams2=2,ngrams1 -c -p -m 3 README
README:en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$
ເຖິງ DO
· ເພີ່ມສະວິດເພື່ອບໍ່ສົນໃຈ tags HTML (ແລະບາງທີຮູບແບບອື່ນໆເຊັ່ນດຽວກັນ)
ໃຊ້ langidentp ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net