これは Colly という名前の Linux アプリで、その最新リリースは v2.1.0.zip としてダウンロードできます。 これは、ワークステーション用の無料のホスティング プロバイダーである OnWorks でオンラインで実行できます。
Colly with OnWorks という名前のこのアプリをオンラインで無料でダウンロードして実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
スクリーンショットは
Ad
コリー
DESCRIPTION
Colly は、あらゆる種類のクローラー/スクレーパー/スパイダーを作成するためのクリーンなインターフェースを提供します。 Colly を使用すると、Web サイトから構造化データを簡単に抽出できます。これは、データ マイニング、データ処理、アーカイブなど、幅広いアプリケーションに使用できます。 きれいな API。 高速 (単一コアで 1 秒あたり XNUMX リクエスト以上) リクエストの遅延とドメインごとの最大同時実行数を管理します。 Cookie とセッションの自動処理。 同期/非同期/並列スクレイピング。 分散スクレイピング。 非 Unicode 応答のキャッシング、自動エンコード。 robots.txt のサポート。 Google App Engine のサポート。
特徴
- 高速 (シングルコアで 1k リクエスト/秒以上)
- リクエストの遅延とドメインごとの最大同時実行数を管理します
- Cookie とセッションの自動処理
- 同期/非同期/並列スクレイピング
- 分散スクレイピング
- 非 Unicode 応答の自動エンコード
プログラミング言語
Go
カテゴリー
これは https://sourceforge.net/projects/colly.mirror/ からも取得できるアプリケーションです。 これは、OnWorks でホストされており、無料のオペレーティング システムの XNUMX つからオンラインで簡単に実行できます。