これはParseraというLinuxアプリで、最新リリースはv0.2.6sourcecode.tar.gzとしてダウンロードできます。ワークステーション向けの無料ホスティングプロバイダーであるOnWorksでオンラインで実行できます。
OnWorks を使用して、Parsera というこのアプリを無料でダウンロードし、オンラインで実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
スクリーンショットは
Ad
パーセラ
DESCRIPTION
リンクと列の説明だけで、あらゆるウェブサイトからデータをスクレイピングできます。Parseraは、構造が不十分なウェブサイトや乱雑なウェブサイトをスクレイピングするために設計されたツールです。
オプション
- 難しいサイトからデータを抽出するためのWebスクレイピングツール
- 乱雑なHTML構造を効果的に処理します
- 高度な解析ルールをサポート
- 非構造化ソースから構造化データを抽出します
- 柔軟な出力形式(CSV、JSON)を提供します
- カスタマイズ可能な抽出パターン
プログラミング言語
Python
カテゴリー
このアプリケーションは、https://sourceforge.net/projects/parsera.mirror/ からも入手できます。OnWorks でホストされているため、無料のオペレーティングシステムから最も簡単にオンラインで実行できます。