Ito ang Windows app na pinangalanang crwlr na ang pinakabagong release ay maaaring ma-download bilang v1.2.2.zip. Maaari itong patakbuhin online sa libreng hosting provider na OnWorks para sa mga workstation.
I-download at patakbuhin online ang app na ito na pinangalanang crwlr gamit ang OnWorks nang libre.
Sundin ang mga tagubiling ito upang patakbuhin ang app na ito:
- 1. Na-download ang application na ito sa iyong PC.
- 2. Ipasok sa aming file manager https://www.onworks.net/myfiles.php?username=XXXXX kasama ang username na gusto mo.
- 3. I-upload ang application na ito sa naturang filemanager.
- 4. Magsimula ng anumang OS OnWorks online emulator mula sa website na ito, ngunit mas mahusay na Windows online emulator.
- 5. Mula sa OnWorks Windows OS na kasisimula mo pa lang, pumunta sa aming file manager https://www.onworks.net/myfiles.php?username=XXXX gamit ang username na gusto mo.
- 6. I-download ang application at i-install ito.
- 7. I-download ang Wine mula sa iyong mga Linux distributions software repository. Kapag na-install na, maaari mong i-double click ang app upang patakbuhin ang mga ito gamit ang Wine. Maaari mo ring subukan ang PlayOnLinux, isang magarbong interface sa ibabaw ng Wine na tutulong sa iyong mag-install ng mga sikat na programa at laro sa Windows.
Ang alak ay isang paraan upang patakbuhin ang software ng Windows sa Linux, ngunit walang kinakailangang Windows. Ang alak ay isang open-source na layer ng compatibility ng Windows na maaaring direktang magpatakbo ng mga program sa Windows sa anumang desktop ng Linux. Sa totoo lang, sinusubukan ng Wine na muling ipatupad ang sapat na Windows mula sa simula upang mapatakbo nito ang lahat ng mga Windows application na iyon nang hindi talaga nangangailangan ng Windows.
MGA LALAKI
Ad
crwlr
DESCRIPTION
Nagbibigay ang library na ito ng uri ng isang balangkas at maraming handa nang gamitin, tinatawag na mga hakbang, na magagamit mo bilang mga bloke ng gusali, para bumuo ng sarili mong mga crawler at scraper. Bago sumisid sa silid-aklatan, tingnan natin ang mga terminong pag-crawl at pag-scrape. Para sa karamihan ng mga real-world na sitwasyon ng paggamit, ang dalawang bagay na iyon ay magkakasabay, kaya naman ang library na ito ay tumutulong at pinagsasama ang dalawa. Ang isang (web) crawler ay isang program na (nagpa-down) ng mga dokumento at sumusunod sa mga link dito upang i-load din ang mga ito. Ang isang crawler ay maaari lang talagang mag-load ng lahat ng mga link na hinahanap nito (at pinapayagang mag-load ayon sa robots.txt file), pagkatapos ay ilo-load lang nito ang buong internet (kung ang (mga) URL na sinisimulan nito ay walang dead end). O maaari itong paghigpitan na mag-load lamang ng mga link na tumutugma sa ilang pamantayan (sa parehong domain/host, ang path ng URL ay nagsisimula sa "/foo",...) o sa isang partikular na lalim. Ang lalim ng 3 ay nangangahulugang 3 antas ang lalim. Ang mga link na makikita sa mga unang URL na ibinigay sa crawler ay antas 1 at iba pa.
Mga tampok
- Crawler Politeness (paggalang sa robots.txt, throttling,...)
- Kumuha ng ganap na mga link mula sa mga HTML na dokumento
- Kumuha ng mga sitemap mula sa robots.txt at kunin ang lahat ng URL mula sa mga sitemap na iyon
- I-crawl (i-load) ang lahat ng pahina ng isang website
- Gumamit ng anumang mga pamamaraan ng HTTP (GET, POST,...) at magpadala ng anumang mga header o body
- Ulitin ang paglipas ng pahina ng listahan
Wika ng Programming
PHP
Kategorya
Ito ay isang application na maaari ding kunin mula sa https://sourceforge.net/projects/crwlr.mirror/. Na-host ito sa OnWorks upang mapatakbo online sa pinakamadaling paraan mula sa isa sa aming mga libreng Operative System.