これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド dumppdf です。
プログラム:
NAME
dumppdf - PDF ファイルの内部コンテンツをダンプします
SYNOPSIS
ダンプPDF [オプション...] file...
DESCRIPTION
ダンプPDF PDF ファイルの内部コンテンツを疑似 XML 形式でダンプします。 このプログラムは
主にデバッグ目的ですが、意味のある情報を抽出することも可能です。
中身
OPTIONS
-a
すべてのオブジェクトをダンプします。 デフォルトでは、ドキュメントのトレーラーのみが印刷されます。
-i オブジェクト番号[,オブジェクト番号,...]
表示する PDF オブジェクト ID を指定します。 カンマ区切りの ID、または複数の ID -i オプションは
受け入れた。
-p ページ番号[,ページ番号,...]
抽出するページ番号のカンマ区切りリストを指定します。 ページ番号
XNUMXから始めてください。 デフォルトでは、すべてのページからテキストが抽出されます。
-r, -b, -t
ストリームコンテンツの出力形式を指定します。 なぜなら、ストリームオブジェクトの内容は
非常に大きくなる可能性があるため、上記のオプションがいずれも指定されていない場合は省略されます。
-r オプションを選択すると、「生の」ストリームの内容が解凍されずにダンプされます。 と -b
オプションを使用すると、解凍されたコンテンツがバイナリ BLOB としてダンプされます。 と -t オプション、
解凍されたコンテンツは、次のようにテキスト形式でダンプされます。 repr() やり方。 いつ -r
or -b オプションが指定されている場合、保存しやすいようにストリーム ヘッダーは表示されません。
ファイルにソフトウェアを指定する必要があります。
-T
目次を表示します。
-P password
PDF コンテンツにアクセスするためのユーザー パスワードを提供します。
-d
デバッグレベルを上げます。
例
ストリーム オブジェクトを除くすべてのヘッダーとコンテンツをダンプします。
$ ダンプPDF -テスト.pdf
目次をダンプします。
$ ダンプPDF -T テスト.pdf
JPEG 画像を抽出します。
$ ダンプPDF -r -i6 テスト.pdf > 画像.jpeg
onworks.net サービスを使用してオンラインで dumppdf を使用する