これはpdfsandwichという名前のLinuxアプリで、最新リリースはpdfsandwich-0.1.7.tar.bz2としてダウンロードできます。 ワークステーション用の無料ホスティングプロバイダーOnWorksでオンラインで実行できます。
OnWorksでpdfsandwichという名前のこのアプリを無料でダウンロードしてオンラインで実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
pdfサンドイッチ
Ad
DESCRIPTION
pdfsandwichは、「サンドイッチ」OCR pdfファイルを生成します。つまり、画像のみを含む(編集可能なテキストを含まない)pdfファイルは、光学式文字認識(OCR)によって処理され、テキストは画像の「背後」に見えないように各ページに追加されます。
pdfsandwichは、OCRでスキャンされた本やジャーナルに役立つと思われるコマンドラインツールです。 複数列のテキストでもページレイアウトを認識できます。
基本的に、pdfsandwichは、次のバイナリを呼び出すラッパースクリプトです:convert、unpaper、tesseract、gs、およびhocr2pdf(tesseract <3.03の場合)。 Unixシステムで実行されることが知られており、LinuxおよびMacOSXでテストされています。マルチプロセッサシステムでの並列処理をサポートしています。
ほとんどの競合するサンドイッチプログラムとは対照的に、スキューの除去や暗いエッジの除去など、スキャンした画像の前処理を実行します。
詳細については、マニュアルをお読みください。 http://www.tobias-elze.de/pdfsandwich/index.html
Audience
エンドユーザー/デスクトップ
ユーザーインターフェース
コマンドライン
プログラミング言語
OCaml(Objective Caml)
カテゴリー
これは、https://sourceforge.net/projects/pdfsandwich/からも取得できるアプリケーションです。 無料のオペレーティングシステムのXNUMXつから最も簡単な方法でオンラインで実行するために、OnWorksでホストされています。