Dies ist die Windows-App namens webStraktor, deren neueste Version als webStraktor-20140420-R01.zip heruntergeladen werden kann. Es kann online beim kostenlosen Hosting-Anbieter OnWorks für Workstations ausgeführt werden.
Laden Sie diese App namens webStraktor mit OnWorks kostenlos herunter und führen Sie sie online aus.
Befolgen Sie diese Anweisungen, um diese App auszuführen:
- 1. Diese Anwendung auf Ihren PC heruntergeladen.
- 2. Geben Sie in unserem Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX den gewünschten Benutzernamen ein.
- 3. Laden Sie diese Anwendung in einem solchen Dateimanager hoch.
- 4. Starten Sie einen beliebigen OS OnWorks-Online-Emulator von dieser Website, aber einen besseren Windows-Online-Emulator.
- 5. Rufen Sie vom gerade gestarteten OnWorks Windows-Betriebssystem unseren Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX mit dem gewünschten Benutzernamen auf.
- 6. Laden Sie die Anwendung herunter und installieren Sie sie.
- 7. Laden Sie Wine aus den Software-Repositorys Ihrer Linux-Distributionen herunter. Nach der Installation können Sie dann auf die App doppelklicken, um sie mit Wine auszuführen. Sie können auch PlayOnLinux ausprobieren, eine schicke Schnittstelle über Wine, die Ihnen bei der Installation beliebter Windows-Programme und -Spiele hilft.
Wine ist eine Möglichkeit, Windows-Software unter Linux auszuführen, jedoch ohne Windows. Wine ist eine Open-Source-Windows-Kompatibilitätsschicht, die Windows-Programme direkt auf jedem Linux-Desktop ausführen kann. Im Wesentlichen versucht Wine, genügend Windows von Grund auf neu zu implementieren, damit alle diese Windows-Anwendungen ausgeführt werden können, ohne dass Windows tatsächlich benötigt wird.
SCREENSHOTS
Ad
webStraktor
BESCHREIBUNG
webStraktor ist ein programmierbarer Datenextraktions-Client für das World Wide Web. Sein Zweck besteht darin, HTML-basierte Inhalte über das HTTP-Protokoll zu scannen und relevante Informationen zu extrahieren. webStraktor verfügt über eine Skriptsprache, um das Sammeln, Extrahieren und Speichern von im Web verfügbaren Informationen, einschließlich Bildern, zu erleichtern. Die Skriptsprache verwendet Elemente der regulären Ausdrucks- und xPath-Syntax. Die Skriptsprache webStraktor verfügt über einen kleinen Befehlssatz und ihre Syntax ist leicht zu beherrschen.
Das Standardausgabeformat von webStraktor basiert auf XML, entweder in den Codepages ASCII, UTF-8 oder ISO-8859-1 (Latin1).
webStraktor verlässt sich beim Abrufen von Inhalten über das HTTP-Protokoll auf den Apache HttpClient. Es hält sich an das Robots Exclusion Protocol und kann für den anonymen Betrieb konfiguriert werden, indem eine Verbindung zu den vorherrschenden Arten von Web-Proxy-Servern hergestellt wird.
webStraktor erweitert die Funktionalität von Webcrawlern, Spidern oder Bots durch die Integration von Scraping- und Crawling-Funktionen.
Eigenschaften
- programmierbarer Webcrawler (Web Spider oder Web Bot)
- leicht zu beherrschende Skriptsprache
- Java Swing-basierte grafische Entwicklungsumgebung
- UTF8- oder ISO-8859-1-XML-Ausgabe
- lässt sich in leicht verfügbare Planungsanwendungen integrieren
- erschöpfende Konfiguration
- Unterstützung für Web-Proxy-Server
- Unterstützung des Roboterausschlussprotokolls
- konfigurierbare User-Agent-Signatur
- Schritt-für-Schritt-Anleitung und Beispielskripte
- Apache HttpClient basiert
Publikum
Entwickler, Architekten
Benutzeroberfläche
Java-Schaukel
Programmiersprache
Javac
Datenbankumgebung
XML-basiert
Dies ist eine Anwendung, die auch von https://sourceforge.net/projects/webstraktor/ abgerufen werden kann. Es wurde in OnWorks gehostet, um es auf einfachste Weise online über eines unserer kostenlosen Betriebssysteme ausführen zu können.





