これは tika-python という名前の Linux アプリで、その最新リリースは ApacheTika2.6.0Release.zip としてダウンロードできます。 これは、ワークステーション用の無料のホスティング プロバイダーである OnWorks でオンラインで実行できます。
OnWorks で tika-python という名前のこのアプリをオンラインで無料でダウンロードして実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
スクリーンショットは
Ad
ティカパイソン
DESCRIPTION
Tika REST サーバーを使用して Tika を使用可能にする Apache Tika ライブラリーの Python ポート。 これにより、Apache Tika を Python ライブラリとして利用できるようになり、Setuptools や Pip を介してインストールでき、簡単にインストールできます。 このライブラリを使用するには、tika-python がバックグラウンドで Tika REST サーバーを起動するため、システムに Java 7+ をインストールする必要があります。 切断された環境でこれを機能させるには、tika サーバー ファイル (tika-server.jar と tika-server.jar.md5 の両方) をダウンロードし、TIKA_SERVER_JAR 環境変数を TIKA_SERVER_JAR="file:// に設定します。 //tika-server.jar」は、このファイルを「ダウンロード」して /tmp/tika-server.jar に移動し、バックグラウンド プロセスとして実行するように python-tika に正常に指示します。 これは、インターネットにアクセスせずに python-tika を実行する唯一の方法です。 この設定がない場合、デフォルトでは tika のバージョンを確認し、毎回 Apache から最新のものを取得します。
オプション
- パーサー インターフェイス (REST より前の後方互換性)
- パーサー インターフェイスは、/rmeta インターフェイスを使用してテキストとメタデータを抽出します。
- 必要に応じて、複数インスタンスの実行に役立つ呼び出しと共に Tika サーバー URL を渡すことができます
- 出力形式を XHTML に指定する
- unpack インターフェイスは、XNUMX 回の呼び出しでメタデータとテキスト抽出の両方を処理します
- 内部的に展開されたメタデータとテキスト エントリの tarball を内部的に返します。
プログラミング言語
Python
カテゴリー
これは https://sourceforge.net/projects/tika-python.mirror/ からも取得できるアプリケーションです。 これは、OnWorks でホストされており、無料のオペレーティング システムの XNUMX つからオンラインで簡単に実行できます。