ນີ້ແມ່ນແອັບ Windows ທີ່ມີຊື່ວ່າ dude uncomplicated data extraction which latest release can be downloaded as EnablePoetryvirtualenv.zip. ມັນສາມາດດໍາເນີນການອອນໄລນ໌ຢູ່ໃນຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີ OnWorks ສໍາລັບສະຖານີບ່ອນເຮັດວຽກ.
ດາວນ໌ໂຫລດແລະດໍາເນີນການອອນໄລນ໌ app ນີ້ມີຊື່ dude uncomplicated data extraction ກັບ OnWorks ໄດ້ຟຣີ.
ປະຕິບັດຕາມຄໍາແນະນໍາເຫຼົ່ານີ້ເພື່ອດໍາເນີນການ app ນີ້:
- 1. ດາວໂຫຼດຄໍາຮ້ອງສະຫມັກນີ້ໃນ PC ຂອງທ່ານ.
- 2. ໃສ່ໃນຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 3. ອັບໂຫລດແອັບພລິເຄຊັນນີ້ຢູ່ໃນຕົວຈັດການໄຟລ໌ດັ່ງກ່າວ.
- 4. ເລີ່ມ emulator ອອນ ໄລ ນ ໌ OS OnWorks ຈາກ ເວັບ ໄຊ ທ ໌ ນີ້, ແຕ່ ດີກ ວ່າ Windows ອອນ ໄລ ນ ໌ emulator.
- 5. ຈາກ OnWorks Windows OS ທີ່ເຈົ້າຫາກໍ່ເລີ່ມຕົ້ນ, ໄປທີ່ຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 6. ດາວນ໌ໂຫລດຄໍາຮ້ອງສະຫມັກແລະຕິດຕັ້ງມັນ.
- 7. ດາວໂຫລດ Wine ຈາກບ່ອນເກັບມ້ຽນຊອບແວການແຈກຢາຍ Linux ຂອງທ່ານ. ເມື່ອຕິດຕັ້ງແລ້ວ, ທ່ານສາມາດຄລິກສອງຄັ້ງ app ເພື່ອດໍາເນີນການໃຫ້ເຂົາເຈົ້າກັບ Wine. ນອກນັ້ນທ່ານຍັງສາມາດລອງ PlayOnLinux, ການໂຕ້ຕອບທີ່ແປກປະຫຼາດໃນໄລຍະ Wine ທີ່ຈະຊ່ວຍໃຫ້ທ່ານຕິດຕັ້ງໂປລແກລມ Windows ແລະເກມທີ່ນິຍົມ.
ເຫຼົ້າແວງເປັນວິທີການແລ່ນຊອບແວ Windows ໃນ Linux, ແຕ່ບໍ່ມີ Windows ທີ່ຕ້ອງການ. ເຫຼົ້າແວງແມ່ນຊັ້ນຄວາມເຂົ້າກັນໄດ້ຂອງ Windows ແຫຼ່ງເປີດທີ່ສາມາດເອີ້ນໃຊ້ໂຄງການ Windows ໂດຍກົງໃນ desktop Linux ໃດກໍໄດ້. ໂດຍພື້ນຖານແລ້ວ, Wine ກໍາລັງພະຍາຍາມປະຕິບັດໃຫມ່ຢ່າງພຽງພໍຂອງ Windows ຕັ້ງແຕ່ເລີ່ມຕົ້ນເພື່ອໃຫ້ມັນສາມາດດໍາເນີນການຄໍາຮ້ອງສະຫມັກ Windows ທັງຫມົດໄດ້ໂດຍບໍ່ຕ້ອງໃຊ້ Windows.
ໜ້າ ຈໍ
Ad
dude ການສະກັດເອົາຂໍ້ມູນທີ່ບໍ່ສັບສົນ
ລາຍລະອຽດ
Dude ແມ່ນກອບງ່າຍດາຍຫຼາຍສໍາລັບການຂຽນ scrapers ເວັບໂດຍໃຊ້ Python decorators. ການອອກແບບ, ໄດ້ຮັບການດົນໃຈໂດຍ Flask, ແມ່ນເພື່ອສ້າງຕົວຂູດເວັບໄດ້ຢ່າງງ່າຍດາຍໃນລະຫັດສອງສາມເສັ້ນ. Dude ມີ syntax ງ່າຍທີ່ຈະຮຽນຮູ້. Dude ປະຈຸບັນຢູ່ໃນ Pre-Alpha. ກະລຸນາຄາດຫວັງວ່າການປ່ຽນແປງທີ່ແຕກຫັກ. ທ່ານສາມາດດໍາເນີນການ scraper ຂອງທ່ານຈາກ terminal / shell / command-line ໂດຍການສະຫນອງ URLs, ຊື່ໄຟລ໌ຜົນຜະລິດທີ່ທ່ານເລືອກແລະເສັ້ນທາງໄປຫາ script python ຂອງທ່ານເພື່ອ dude ຄໍາສັ່ງ scrape.
ຄຸນລັກສະນະ
- scraper ເວັບຫນ້ອຍ
- ຜົນໄດ້ຮັບໃນ data.json ຄວນຈະມີ URL ຕົວຈິງແລະ metadata ທີ່ຢູ່ຂ້າງຫນ້າດ້ວຍ underscore
- ການອອກແບບທີ່ດົນໃຈ Flask ແບບງ່າຍດາຍ - ສ້າງເຄື່ອງຂູດດ້ວຍເຄື່ອງຕົບແຕ່ງ
- ໃຊ້ Playwright API - ແລ່ນ scraper ຂອງທ່ານໃນ Chrome, Firefox ແລະ Webkit ແລະໃຊ້ເຄື່ອງຈັກເລືອກທີ່ມີປະສິດທິພາບຂອງ Playwright ທີ່ສະຫນັບສະຫນູນ CSS, XPath, text, regex, ແລະອື່ນໆ.
- ການຈັດກຸ່ມຂໍ້ມູນ - ຜົນໄດ້ຮັບທີ່ກ່ຽວຂ້ອງກັບກຸ່ມ
- ການຈັບຄູ່ຮູບແບບ URL - ປະຕິບັດຫນ້າທີ່ຢູ່ໃນ URL ທີ່ກົງກັນ
- ຟັງຊັນການຕັ້ງຄ່າ - ເປີດໃຊ້ຂັ້ນຕອນການຕັ້ງຄ່າ (ຄລິກກ່ອງໂຕ້ຕອບ ຫຼືເຂົ້າສູ່ລະບົບ)
ພາສາການຂຽນໂປຣແກຣມ
Python
ປະເພດ
ນີ້ແມ່ນແອັບພລິເຄຊັນທີ່ຍັງສາມາດເອົາມາຈາກ https://sourceforge.net/projects/dude-uncomp-data-ext.mirror/. ມັນໄດ້ຖືກຈັດຢູ່ໃນ OnWorks ເພື່ອໃຫ້ດໍາເນີນການອອນໄລນ໌ດ້ວຍວິທີທີ່ງ່າຍທີ່ສຸດຈາກຫນຶ່ງໃນລະບົບປະຕິບັດງານຟຣີຂອງພວກເຮົາ.