これはScrapyというLinuxアプリで、最新リリースは2.13.3sourcecode.tar.gzとしてダウンロードできます。ワークステーション向けの無料ホスティングプロバイダーOnWorksでオンラインで実行できます。
Scrapy withOnWorksという名前のこのアプリを無料でダウンロードしてオンラインで実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
スクリーンショットは
Ad
スクラップ
DESCRIPTION
Scrapyは、Webサイトをクロールし、これらのWebサイトから構造化データを抽出するための高速でオープンソースの高レベルのフレームワークです。 ポータブルでPythonで記述されているため、Windows、Linux、macOS、BSDで実行できます。
Scrapyは強力で、高速でシンプルであり、簡単に拡張できます。 ルールを記述してデータを抽出し、必要に応じてコアに触れることなく新しい機能を追加するだけです。 Scrapyが残りを行い、多くのアプリケーションで使用できます。 データマイニング、監視、自動テストに使用できます。
オプション
- 正規表現を使用して抽出するためのヘルパーメソッドを使用した、拡張XPath式およびCSSセレクターを介したHTML / XMLソースからのデータの選択と抽出の組み込みサポート
- CSSおよびXPath式を使用してデータをスクレイピングするためのインタラクティブなシェルコンソール
- いくつかの異なる形式(JSON、XML、CSV)でフィードエクスポートを生成し、さまざまなバックエンド(S3、FTP、ローカルファイルシステム)に保存するための組み込みサポート
- エンコーディングと自動検出のサポート
- 強力な拡張性のサポート
- Cookieとセッション処理、robots.txt、クロール深度制限などのための多数の組み込み拡張機能とミドルウェア
- Scrapyプロセス内で実行されているPythonコンソールにフックするTelnetコンソール
- 再利用可能なスパイダー、メディアパイプライン、キャッシングDNSリゾルバーなど
プログラミング言語
Python
カテゴリー
これは、https://sourceforge.net/projects/scrapy.mirror/からも取得できるアプリケーションです。 無料のオペレーティングシステムのXNUMXつから最も簡単な方法でオンラインで実行するために、OnWorksでホストされています。