ນີ້ແມ່ນຄໍາສັ່ງ ids2ngram ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
ids2ngram - ສ້າງໄຟລ໌ຂໍ້ມູນ n-gram ຈາກໄຟລ໌ ids
ສະຫຼຸບສັງລວມ
ids2ngram [ທາງເລືອກ] ... ids_file...
ລາຍລະອຽດ
ids2ngram ສ້າງໄຟລ໌ idngram, ເຊິ່ງເປັນການຈັດຮຽງ [id1,..,idN,freq] array, ຈາກ binary.
id stream ໄຟລ໌. ທີ່ນີ້, id stream ໄຟລ໌ແມ່ນສ້າງຂຶ້ນໂດຍສະເຫມີ mmseg or slmseg.
ໂດຍພື້ນຖານແລ້ວ, ມັນພົບເຫັນການປະກົດຕົວທັງຫມົດຂອງ tuples n-words (ເຊັ່ນ tuple ຂອງ (id1,..,idN)), ແລະ
ຈັດຮຽງ tuples ເຫຼົ່ານີ້ໂດຍລໍາດັບ lexicographic ຂອງ ids ປະກອບ tuples, ຫຼັງຈາກນັ້ນຂຽນ.
ໃຫ້ເຂົາເຈົ້າກັບໄຟລ໌ຜົນຜະລິດທີ່ລະບຸໄວ້.
ປັດໄຈນໍາເຂົ້າ
ໄຟລ໌ປ້ອນຂໍ້ມູນຖືກນຳສະເໜີເປັນ binary id stream, ເຊິ່ງເບິ່ງຄືວ່າ:
[id0,...,idX]
OPTIONS
ຕົວເລືອກຕໍ່ໄປນີ້ແມ່ນບັງຄັບ.
-n,--NMax N
ສ້າງ N-gram ຜົນໄດ້ຮັບ. ids2ngram ຮອງຮັບພຽງແຕ່ uni-gram, bi-gram, ແລະ trigram,
ດັ່ງນັ້ນຕົວເລກໃດໆທີ່ບໍ່ຢູ່ໃນຂອບເຂດຂອງ 1..3 ບໍ່ຖືກຕ້ອງ.
-s,--ສະຫຼັບ swap-file
ລະບຸໄຟລ໌ປານກາງຊົ່ວຄາວ.
-o, --ອອກ output-file
ລະບຸໄຟລ໌ idngram ຜົນໄດ້ຮັບ, ເຊັ່ນ: array ຂອງ [id1, ..., idN, freq]
-p, --para N
ລະບຸລາຍການ n-gram ສູງສຸດຕໍ່ວັກ. ids2ngram ຂຽນໃສ່ໄຟລ໌ຊົ່ວຄາວ
ບົນພື້ນຖານຕໍ່ວັກ. ທຸກຄັ້ງທີ່ມັນຂຽນຫຍໍ້ໜ້າອອກ, ມັນຈະປົດປ່ອຍ
ຫນ່ວຍຄວາມຈໍາທີ່ສອດຄ້ອງກັນຈັດສັນສໍາລັບມັນ. ເມື່ອລະບົບຄອມພິວເຕີຂອງທ່ານອະນຸຍາດ, ສູງຂຶ້ນ N
ແມ່ນແນະນໍາ. ນີ້ສາມາດເລັ່ງຄວາມໄວໃນການປະມວນຜົນໄດ້ເນື່ອງຈາກ I/O ໜ້ອຍລົງ.
EXAMPLE
ຕົວຢ່າງຕໍ່ໄປນີ້ຈະໃຊ້ສາມ input idstream file idsfile[1,2,3] ເພື່ອສ້າງ
idngram ໄຟລ໌ all.id3gram. ແຕ່ລະ para (ຂະຫນາດແຜນທີ່ພາຍໃນຫຼືຂະຫນາດ hash) ຈະເປັນ 1024000,
ການນໍາໃຊ້ໄຟລ໌ swap ສໍາລັບຜົນໄດ້ຮັບ temp. ຜົນໄດ້ຮັບ temp para ທັງຫມົດຈະຖືກລວມເຂົ້າກັນເພື່ອໃຫ້ໄດ້
ຜົນສຸດທ້າຍ.
ids2ngram -n 3 -s /tmp/swap -o all.id3gram -p 1024000 idsfile1 idsfile2 idsfile3
ໃຊ້ ids2ngram ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net