これはMinerUというLinuxアプリで、最新リリースはmineru-2.1.0-releasedsourcecode.tar.gzとしてダウンロードできます。ワークステーション向けの無料ホスティングプロバイダーOnWorksでオンラインで実行できます。
OnWorks を使用して、MinerU というこのアプリを無料でダウンロードし、オンラインで実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
スクリーンショット:
マイナーU
説明:
MinerUは、PDF(およびその他のドキュメント形式)を構造化されたMarkdownおよびJSONに変換することに重点を置いた、オープンソースの高品質ドキュメント抽出ツールキットです。OCRとレイアウト解析を活用してセマンティック構造とメタデータを保持し、研究やデータサイエンスのワークフローに最適です。
オプション
- PDFをMarkdownと構造化されたJSONに変換します
- OCRとレイアウトを考慮したコンテンツ抽出
- 見出しや数式などの文書構造を保持します
- 科学文献と記号認識をサポート
- ドキュメント取り込みのためのワンストップCLIツール
- AGPLライセンスで積極的に開発中
プログラミング言語
Python
カテゴリー
このアプリケーションは、https://sourceforge.net/projects/mineru.mirror/ からも入手できます。OnWorks でホストされているため、無料のオペレーティングシステムから最も簡単にオンラインで実行できます。