Aceasta este aplicația Windows numită Scrapy-Redis a cărei ultimă versiune poate fi descărcată ca Version0.7.1Released.zip. Poate fi rulat online în furnizorul gratuit de găzduire OnWorks pentru stații de lucru.
Descărcați și rulați online această aplicație numită Scrapy-Redis cu OnWorks gratuit.
Urmați aceste instrucțiuni pentru a rula această aplicație:
- 1. Ați descărcat această aplicație pe computer.
- 2. Introduceți în managerul nostru de fișiere https://www.onworks.net/myfiles.php?username=XXXXX cu numele de utilizator pe care îl doriți.
- 3. Încărcați această aplicație într-un astfel de manager de fișiere.
- 4. Porniți orice emulator online OS OnWorks de pe acest site, dar mai bun emulator online Windows.
- 5. Din sistemul de operare Windows OnWorks pe care tocmai l-ați pornit, accesați managerul nostru de fișiere https://www.onworks.net/myfiles.php?username=XXXXX cu numele de utilizator dorit.
- 6. Descărcați aplicația și instalați-o.
- 7. Descărcați Wine din depozitele de software ale distribuțiilor Linux. Odată instalat, puteți apoi să faceți dublu clic pe aplicație pentru a le rula cu Wine. De asemenea, puteți încerca PlayOnLinux, o interfață elegantă peste Wine, care vă va ajuta să instalați programe și jocuri populare Windows.
Wine este o modalitate de a rula software-ul Windows pe Linux, dar fără a fi necesar Windows. Wine este un strat de compatibilitate Windows open-source care poate rula programe Windows direct pe orice desktop Linux. În esență, Wine încearcă să reimplementeze suficient Windows de la zero, astfel încât să poată rula toate acele aplicații Windows fără a avea nevoie efectiv de Windows.
SCREENSHOTS
Ad
Scrapy-Redis
DESCRIERE
Puteți porni mai multe instanțe spider care partajează o singură coadă redis. Cel mai potrivit pentru accesări cu crawlere pe mai multe domenii. Articolele răzuite sunt împinse într-o coadă redis, ceea ce înseamnă că puteți începe atâtea procese de post-procesare necesare, care partajează coada de articole. Programator + Filtru de duplicare, Conductă de articole, Păianjeni de bază. Serializatorul de solicitări implicit este pickle, dar poate fi schimbat la orice modul cu funcții de încărcare și descărcare. Rețineți că pickle nu este compatibil între versiunile Python. Versiunea 0.3 a schimbat serializarea cererilor de la marshal la cPickle, prin urmare cererile persistente folosind versiunea 0.2 nu vor putea funcționa pe 0.3. Clasa scrapy_redis.spiders.RedisSpider permite unui păianjen să citească adresele URL de la redis. Url-urile din coada redis vor fi procesate una după alta, dacă prima solicitare generează mai multe solicitări, spider-ul va procesa acele solicitări înainte de a prelua un alt URL de la redis.
DESCRIERE
- Târătură/răzuire distribuită
- Post-procesare distribuită
- Componente Scrapy plug-and-play
- Este necesar Python 2.7, 3.4 sau 3.5
- Redis >= 2.8 necesar
- Programator + Filtru de duplicare, Conductă de articole, Păianjeni de bază
Limbaj de programare
Piton
Aceasta este o aplicație care poate fi preluată și de la https://sourceforge.net/projects/scrapy-redis.mirror/. A fost găzduit în OnWorks pentru a fi rulat online într-un mod cât mai ușor de pe unul dintre sistemele noastre operative gratuite.