これはGrab Framework ProjectというLinuxアプリで、最新リリースはgrabv1.2.0sourcecode.zipとしてダウンロードできます。ワークステーション向けの無料ホスティングプロバイダーOnWorksでオンラインで実行できます。
OnWorks を使用した Grab Framework Project という名前のこのアプリを無料でダウンロードしてオンラインで実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
スクリーンショットは
Ad
グラブ フレームワーク プロジェクト
DESCRIPTION
Grab は、Web スクレイパーを構築するための Python フレームワークです。 Grab を使用すると、単純な 5 行のスクリプトから、数百万の Web ページを処理する複雑な非同期 Web クローラーまで、さまざまな複雑さの Web スクレイパーを構築できます。 Grab は、ネットワーク リクエストを実行し、受信したコンテンツを処理するための API を提供します。たとえば、HTML ドキュメントの DOM ツリーと対話します。 ネットワーク リクエストを作成して実行し、受信したコンテンツを操作できる単一のリクエスト/レスポンス API。 API は、urllib3 および lxml ライブラリの上に構築されています。 非同期 Web クローラーを構築するための Spider API。 ネットワーク要求のタイプごとにハンドラーを定義するクラスを作成します。 各ハンドラは、新しいネットワーク リクエストを生成できます。 ネットワーク要求は、非同期 Web ソケットのプールで同時に処理されます。 Grab は、Spider と呼ばれるマルチスレッド Web サイト スクレーパーを開発するためのインターフェイスを提供します。
オプション
- 自動 Cookie (セッション) のサポート
- 認証あり/なしの HTTPS/SOCKS プロキシのサポート
- IDNサポート
- Web フォームを操作するためのツール
- 簡単なマルチパート ファイルのアップロード
- HTTP リクエストの柔軟なカスタマイズ
プログラミング言語
Python
カテゴリー
これは https://sourceforge.net/projects/grab-framework-project.mirror/ からも取得できるアプリケーションです。 これは、OnWorks でホストされており、無料のオペレーティング システムの XNUMX つからオンラインで簡単に実行できます。