ນີ້ແມ່ນແອັບ Windows ທີ່ມີຊື່ວ່າ Crawlab ເຊິ່ງລຸ້ນຫຼ້າສຸດສາມາດດາວໂຫຼດໄດ້ເປັນ v0.6.3.zip. ມັນສາມາດດໍາເນີນການອອນໄລນ໌ຢູ່ໃນຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີ OnWorks ສໍາລັບສະຖານີບ່ອນເຮັດວຽກ.
ດາວນ໌ໂຫລດແລະດໍາເນີນການອອນໄລນ໌ app ນີ້ມີຊື່ Crawlab ກັບ OnWorks ໄດ້ຟຣີ.
ປະຕິບັດຕາມຄໍາແນະນໍາເຫຼົ່ານີ້ເພື່ອດໍາເນີນການ app ນີ້:
- 1. ດາວໂຫຼດຄໍາຮ້ອງສະຫມັກນີ້ໃນ PC ຂອງທ່ານ.
- 2. ໃສ່ໃນຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 3. ອັບໂຫລດແອັບພລິເຄຊັນນີ້ຢູ່ໃນຕົວຈັດການໄຟລ໌ດັ່ງກ່າວ.
- 4. ເລີ່ມ emulator ອອນ ໄລ ນ ໌ OS OnWorks ຈາກ ເວັບ ໄຊ ທ ໌ ນີ້, ແຕ່ ດີກ ວ່າ Windows ອອນ ໄລ ນ ໌ emulator.
- 5. ຈາກ OnWorks Windows OS ທີ່ເຈົ້າຫາກໍ່ເລີ່ມຕົ້ນ, ໄປທີ່ຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 6. ດາວນ໌ໂຫລດຄໍາຮ້ອງສະຫມັກແລະຕິດຕັ້ງມັນ.
- 7. ດາວໂຫລດ Wine ຈາກບ່ອນເກັບມ້ຽນຊອບແວການແຈກຢາຍ Linux ຂອງທ່ານ. ເມື່ອຕິດຕັ້ງແລ້ວ, ທ່ານສາມາດຄລິກສອງຄັ້ງ app ເພື່ອດໍາເນີນການໃຫ້ເຂົາເຈົ້າກັບ Wine. ນອກນັ້ນທ່ານຍັງສາມາດລອງ PlayOnLinux, ການໂຕ້ຕອບທີ່ແປກປະຫຼາດໃນໄລຍະ Wine ທີ່ຈະຊ່ວຍໃຫ້ທ່ານຕິດຕັ້ງໂປລແກລມ Windows ແລະເກມທີ່ນິຍົມ.
ເຫຼົ້າແວງເປັນວິທີການແລ່ນຊອບແວ Windows ໃນ Linux, ແຕ່ບໍ່ມີ Windows ທີ່ຕ້ອງການ. ເຫຼົ້າແວງແມ່ນຊັ້ນຄວາມເຂົ້າກັນໄດ້ຂອງ Windows ແຫຼ່ງເປີດທີ່ສາມາດເອີ້ນໃຊ້ໂຄງການ Windows ໂດຍກົງໃນ desktop Linux ໃດກໍໄດ້. ໂດຍພື້ນຖານແລ້ວ, Wine ກໍາລັງພະຍາຍາມປະຕິບັດໃຫມ່ຢ່າງພຽງພໍຂອງ Windows ຕັ້ງແຕ່ເລີ່ມຕົ້ນເພື່ອໃຫ້ມັນສາມາດດໍາເນີນການຄໍາຮ້ອງສະຫມັກ Windows ທັງຫມົດໄດ້ໂດຍບໍ່ຕ້ອງໃຊ້ Windows.
ໜ້າ ຈໍ
Ad
Crawlab
ລາຍລະອຽດ
ແພລະຕະຟອມການຈັດການຕົວກວາດເວັບທີ່ແຈກຢາຍໂດຍອີງໃສ່ Golang, ສະຫນັບສະຫນູນພາສາຕ່າງໆລວມທັງ Python, NodeJS, Go, Java, PHP ແລະກອບການລວບລວມຂໍ້ມູນເວັບຕ່າງໆລວມທັງ Scrapy, Puppeteer, Selenium. ກະລຸນາໃຊ້ docker-compose ເພື່ອຄລິກດຽວເພື່ອເລີ່ມຕົ້ນ. ໂດຍການເຮັດດັ່ງນັ້ນ, ທ່ານບໍ່ ຈຳ ເປັນຕ້ອງຕັ້ງຄ່າຖານຂໍ້ມູນ MongoDB. ແອັບ frontend ໂຕ້ຕອບກັບແມ່ບົດ, ເຊິ່ງຕິດຕໍ່ສື່ສານກັບອົງປະກອບອື່ນໆເຊັ່ນ: MongoDB, SeaweedFS ແລະ nodes ຄົນງານ. ໂຫມດແມ່ບົດແລະໂຫມດຜູ້ເຮັດວຽກຕິດຕໍ່ສື່ສານເຊິ່ງກັນແລະກັນຜ່ານ gRPC (ກອບ RPC). ວຽກງານແມ່ນຖືກກໍານົດໂດຍໂມດູນຕາຕະລາງວຽກໃນແມ່ບົດ, ແລະໄດ້ຮັບໂດຍໂມດູນຕົວຈັດການວຽກໃນໂຫມດຜູ້ເຮັດວຽກ, ເຊິ່ງປະຕິບັດວຽກງານເຫຼົ່ານີ້ຢູ່ໃນຕົວແລ່ນວຽກ. ຕົວຈິງແລ້ວນັກແລ່ນວຽກແມ່ນຂະບວນການທີ່ດໍາເນີນໂຄງການ spider ຫຼືຕົວກວາດເວັບ, ແລະຍັງສາມາດສົ່ງຂໍ້ມູນຜ່ານ gRPC (ປະສົມປະສານໃນ SDK) ໄປຫາແຫຼ່ງຂໍ້ມູນອື່ນໆ, ເຊັ່ນ MongoDB.
ຄຸນລັກສະນະ
- ການກຳນົດເວລາໜ້າວຽກ
- ການຈັດການ ແລະການສື່ສານຂອງ Worker Node
- Spider deployment
- ບໍລິການ Frontend ແລະ API
- ການປະຕິບັດວຽກງານ (ທ່ານສາມາດຖື Master Node ເປັນ Worker Node)
- ການປະສົມປະສານກັບກອບອື່ນໆ
ພາສາການຂຽນໂປຣແກຣມ
Python, PHP, Java, Go
ປະເພດ
ນີ້ແມ່ນແອັບພລິເຄຊັນທີ່ຍັງສາມາດເອົາມາຈາກ https://sourceforge.net/projects/crawlab.mirror/. ມັນໄດ້ຖືກຈັດຢູ່ໃນ OnWorks ເພື່ອໃຫ້ດໍາເນີນການອອນໄລນ໌ດ້ວຍວິທີທີ່ງ່າຍທີ່ສຸດຈາກຫນຶ່ງໃນລະບົບປະຕິບັດງານຟຣີຂອງພວກເຮົາ.