これは webStraktor という名前の Windows アプリで、最新リリースは webStraktor-20140420-R01.zip としてダウンロードできます。ワークステーション用の無料ホスティング プロバイダー OnWorks でオンラインで実行できます。
WebStraktor という名前のこのアプリを OnWorks で無料でオンラインでダウンロードして実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOSOnWorksオンラインエミュレーターを起動しますが、Windowsオンラインエミュレーターの方が優れています。
-5。起動したばかりのOnWorksWindows OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードしてインストールします。
-7.LinuxディストリビューションソフトウェアリポジトリからWineをダウンロードします。 インストールしたら、アプリをダブルクリックして、Wineで実行できます。 また、人気のあるWindowsプログラムやゲームのインストールに役立つWine上の豪華なインターフェイスであるPlayOnLinuxを試すこともできます。
WineはLinux上でWindowsソフトウェアを実行する方法ですが、Windowsは必要ありません。 Wineは、任意のLinuxデスクトップでWindowsプログラムを直接実行できるオープンソースのWindows互換性レイヤーです。 基本的に、Wineは、実際にWindowsを必要とせずに、これらすべてのWindowsアプリケーションを実行できるように、十分な数のWindowsを最初から再実装しようとしています。
スクリーンショットは
Ad
ウェブストラクター
DESCRIPTION
webStraktor は、プログラム可能な World Wide Web データ抽出クライアントです。 その目的は、HTTP プロトコル経由で HTML ベースのコンテンツをスクレイピングし、関連情報を抽出することです。 webStraktor は、画像を含む Web 上で利用可能な情報の収集、抽出、保存を容易にするスクリプト言語を備えています。 スクリプト言語は、正規表現と xPath 構文の要素を使用します。 webStraktor スクリプト言語の命令セットは小さく、その構文は簡単に習得できます。
標準の webStraktor 出力形式は XML ベースで、ASCII、UTF-8、または ISO-8859-1 (Latin1) コード ページのいずれかです。
webStraktor は、HTTP プロトコル経由でコンテンツを取得するために Apache HttpClient に依存します。 これはロボット排除プロトコルに準拠しており、主要な種類の Web プロキシ サーバーに接続することで匿名で動作するように構成できます。
webStraktor は、スクレイピング機能とクロール機能を統合することにより、Web クローラー、スパイダー、またはボットの機能を拡張します。
オプション
- プログラム可能な Web クローラー (Web スパイダーまたは Web ボット)
- マスターしやすいスクリプト言語
- Java Swingベースのグラフィカル開発環境
- UTF8 または ISO-8859-1 XML 出力
- すぐに利用できるスケジューリング アプリケーションと統合
- 徹底的な構成
- Webプロキシサーバーのサポート
- ロボット排除プロトコルのサポート
- 構成可能なユーザー エージェント署名
- ステップバイステップのチュートリアルとサンプルスクリプト
- Apache HttpClientベース
Audience
開発者、アーキテクト
ユーザーインターフェース
Java Swing
プログラミング言語
Java
データベース環境
XMLベース
これは、https://sourceforge.net/projects/webstraktor/ から取得できるアプリケーションです。 無料のオペレーティング システムの XNUMX つから最も簡単な方法でオンラインで実行できるように、OnWorks でホストされています。





