ນີ້ແມ່ນຄໍາສັ່ງ estwaver ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
estwaver - ການໂຕ້ຕອບເສັ້ນຄໍາສັ່ງຂອງຕົວກວາດເວັບ
ສະຫຼຸບສັງລວມ
estwaver ໃນມັນ [-apn|-acc] [-xs|-xl|-xh] [-sv|-si|-sa] ຮາກ
estwaver ລວບລວມຂໍ້ມູນ [-restart|-revisit|-revcont] ຮາກ
estwaver ທົດສອບ ຮາກ
estwaver ດຶງ [-ຕົວແທນ ເຈົ້າພາບ ທ່າເຮືອ] [-ໂທ ຕົວເລກ] [-il ພາສາ] url
ລາຍລະອຽດ
estwaver ແມ່ນການລວບລວມຄໍາສັ່ງຍ່ອຍ. ຊື່ຂອງຄໍາສັ່ງຍ່ອຍແມ່ນຖືກກໍານົດໂດຍ
ການໂຕ້ຖຽງທໍາອິດ. arguments ອື່ນໆແມ່ນ parse ຕາມແຕ່ລະຄໍາສັ່ງຍ່ອຍ. ການໂຕ້ຖຽງ
ຮາກ ກໍານົດໄດເລກະທໍລີຮາກຂອງຕົວກວາດເວັບທີ່ມີໄຟລ໌ການຕັ້ງຄ່າແລະອື່ນໆ.
estwaver ໃນມັນ [-apn|-acc] [-xs|-xl|-xh] [-sv|-si|-sa] ຮາກ
ສ້າງໄດເລກະທໍລີຮາກຂອງຕົວກວາດເວັບ.
If -apn ຖືກກໍານົດ, ການວິເຄາະ N-gram ແມ່ນປະຕິບັດຕໍ່ກັບຂໍ້ຄວາມເອີຣົບ.
If -acc ໄດ້ຖືກລະບຸໄວ້, ການວິເຄາະປະເພດລັກສະນະແມ່ນປະຕິບັດແທນທີ່ຈະເປັນ N-gram
ການວິເຄາະ.
If -xs ຖືກກໍານົດໄວ້, ດັດຊະນີແມ່ນ tuned ເພື່ອລົງທະບຽນຫນ້ອຍກວ່າ 50000 ເອກະສານ.
If -xl ຖືກກໍານົດໄວ້, ດັດຊະນີແມ່ນ tuned ເພື່ອລົງທະບຽນຫຼາຍກ່ວາ 300000 ເອກະສານ.
If -xh ຖືກກໍານົດໄວ້, ດັດຊະນີແມ່ນ tuned ເພື່ອລົງທະບຽນຫຼາຍກ່ວາ 1000000 ເອກະສານ.
If -sv ຖືກລະບຸໄວ້, ຄະແນນຈະຖືກເກັບໄວ້ເປັນໂມຄະ.
If - ແມ່ນ ຖືກລະບຸໄວ້, ຄະແນນຈະຖືກເກັບໄວ້ເປັນຈຳນວນ 32-bit.
If -sa ໄດ້ຖືກລະບຸໄວ້, ຄະແນນຈະຖືກເກັບໄວ້ຕາມທີ່ເປັນຢູ່ ແລະໝາຍບໍ່ໃຫ້ຖືກປັບເມື່ອໃດ
ຄົ້ນຫາ
estwaver ລວບລວມຂໍ້ມູນ [-restart|-revisit|-revcont] ຮາກ
ເລີ່ມການລວບລວມຂໍ້ມູນ.
If -ເລີ່ມຕົ້ນໃຫມ່ ຖືກກໍານົດ, ການລວບລວມຂໍ້ມູນແມ່ນເລີ່ມຕົ້ນໃຫມ່ຈາກເອກະສານແກ່ນ.
If - ທົບທວນຄືນ ໄດ້ຖືກລະບຸໄວ້, ເອກະສານທີ່ເກັບກໍາໄດ້ຖືກທົບທວນຄືນ.
If -revcont ແມ່ນໄດ້ລະບຸໄວ້, ເອກະສານທີ່ເກັບກໍາແມ່ນ revisited ແລະຫຼັງຈາກນັ້ນ crawling ແມ່ນ
ສືບຕໍ່.
estwaver ທົດສອບ ຮາກ
ປະຕິບັດການທົດສອບຫນ່ວຍ.
estwaver ດຶງ [-ຕົວແທນ ເຈົ້າພາບ ທ່າເຮືອ] [-ໂທ ຕົວເລກ] [-il ພາສາ] url
ເອົາເອກະສານ.
url ລະບຸ URL ຂອງເອກະສານ.
- ຕົວແທນ ລະບຸຊື່ໂຮດ ແລະໝາຍເລກພອດຂອງເຊີບເວີພຣັອກຊີ.
-tout ກໍານົດເວລາຫມົດເວລາໃນວິນາທີ.
-ລາວ ລະບຸພາສາທີ່ຕ້ອງການ. ໂດຍຄ່າເລີ່ມຕົ້ນ, ມັນແມ່ນພາສາອັງກິດ.
ຄໍາສັ່ງຍ່ອຍທັງໝົດສົ່ງຄືນ 0 ຖ້າການດຳເນີນການສຳເລັດ, ອື່ນສົ່ງຄືນ 1. ຕົວກວາດເວັບທີ່ແລ່ນ
ຈົບລົງດ້ວຍການປິດຖານຂໍ້ມູນ ເມື່ອມັນຈັບສັນຍານ 1 (SIGHUP), 2 (SIGINT), 3
(SIGQUIT), ຫຼື 15 (SIGTERM).
ເມື່ອການລວບລວມຂໍ້ມູນສໍາເລັດ, ມີໄດເລກະທໍລີ _index ໃນໄດເລກະທໍລີຮາກຂອງຕົວກວາດເວັບ. ມັນແມ່ນ
ດັດຊະນີທີ່ມີຢູ່ໂດຍ estcmd ແລະອື່ນໆ.
ໃຊ້ estwaver ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net