Aceasta este aplicația Windows numită webStraktor a cărei ultima versiune poate fi descărcată ca webStraktor-20140420-R01.zip. Poate fi rulat online în furnizorul gratuit de găzduire OnWorks pentru stații de lucru.
Descărcați și rulați online această aplicație numită webStraktor cu OnWorks gratuit.
Urmați aceste instrucțiuni pentru a rula această aplicație:
- 1. Ați descărcat această aplicație pe computer.
- 2. Introduceți în managerul nostru de fișiere https://www.onworks.net/myfiles.php?username=XXXXX cu numele de utilizator pe care îl doriți.
- 3. Încărcați această aplicație într-un astfel de manager de fișiere.
- 4. Porniți orice emulator online OS OnWorks de pe acest site, dar mai bun emulator online Windows.
- 5. Din sistemul de operare Windows OnWorks pe care tocmai l-ați pornit, accesați managerul nostru de fișiere https://www.onworks.net/myfiles.php?username=XXXXX cu numele de utilizator dorit.
- 6. Descărcați aplicația și instalați-o.
- 7. Descărcați Wine din depozitele de software ale distribuțiilor Linux. Odată instalat, puteți apoi să faceți dublu clic pe aplicație pentru a le rula cu Wine. De asemenea, puteți încerca PlayOnLinux, o interfață elegantă peste Wine, care vă va ajuta să instalați programe și jocuri populare Windows.
Wine este o modalitate de a rula software-ul Windows pe Linux, dar fără a fi necesar Windows. Wine este un strat de compatibilitate Windows open-source care poate rula programe Windows direct pe orice desktop Linux. În esență, Wine încearcă să reimplementeze suficient Windows de la zero, astfel încât să poată rula toate acele aplicații Windows fără a avea nevoie efectiv de Windows.
SCREENSHOTS
Ad
webStraktor
DESCRIERE
webStraktor este un client programabil de extragere a datelor World Wide Web. Scopul său este de a răzui conținut bazat pe HTML prin protocolul HTTP și de a extrage informații relevante. webStraktor dispune de un limbaj de scripting pentru a facilita colectarea, extragerea și stocarea informațiilor disponibile pe web, inclusiv imagini. Limbajul de scripting folosește elemente ale expresiei regulate și sintaxa xPath. Limbajul de scripting webStraktor are un set mic de instrucțiuni și sintaxa sa este ușor de stăpânit.
Formatul standard de ieșire webStraktor este bazat pe XML, fie în pagini de cod ASCII, UTF-8 sau ISO-8859-1 (Latin1).
webStraktor se bazează pe Apache HttpClient pentru preluarea conținutului prin protocolul HTTP. Aderă la Robots Exclusion Protocol și poate fi configurat să funcționeze într-un mod anonim prin conectarea la tipurile predominante de servere proxy web.
webStraktor extinde funcționalitatea crawlerelor web, a păianjenilor sau a boților prin integrarea capacităților de scraping și crawling.
Categorii
- crawler web programabil (web spider sau web bot)
- limbaj de scripting ușor de stăpânit
- mediu de dezvoltare grafică bazat pe swing java
- Ieșire XML UTF8 sau ISO-8859-1
- se integrează cu aplicații de programare ușor disponibile
- configurație exhaustivă
- suport pentru server proxy web
- suport pentru protocolul de excludere a robotului
- semnătură configurabilă User Agent
- tutorial pas cu pas și exemple de scripturi
- Bazat pe Apache HttpClient
Public
Dezvoltatori, arhitecți
Interfața cu utilizatorul
Java Swing
Limbaj de programare
Java
Mediul bazei de date
Bazat pe XML
Aceasta este o aplicație care poate fi preluată și de la https://sourceforge.net/projects/webstraktor/. A fost găzduit în OnWorks pentru a fi rulat online într-un mod cât mai ușor de pe unul dintre sistemele noastre operative gratuite.





