これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド pdftotext です。
プログラム:
NAME
pdftotext - PDF (Portable Document Format) からテキストへのコンバーター (バージョン 3.03)
SYNOPSIS
pdftotext [オプション] [PDFファイル [テキストファイル]]
DESCRIPTION
Pdfテキスト PDF (Portable Document Format) ファイルをプレーン テキストに変換します。
PDFtotext は PDF ファイルを読み取ります。 PDFファイル、テキスト ファイルを書き込みます。 テキストファイル。 場合 テキストファイル
指定されていない場合は、pdfからテキストに変換されます ファイル.pdf 〜へ ファイル.txt。 場合 テキストファイル '-'、テキストです
標準出力に送信されます。
OPTIONS
-f 数
変換する最初のページを指定します。
-l 数
変換する最後のページを指定します。
-r 数
解像度を DPI で指定します。 デフォルトは 72 DPI です。
-x 数
トリミング領域の左上隅のx座標を指定します
-y 数
トリミング領域の左上隅のy座標を指定します
-W 数
トリミング領域の幅をピクセル単位で指定します(デフォルトは0)
-H 数
トリミング領域の高さをピクセル単位で指定します(デフォルトは0)
-レイアウト
テキストの元の物理レイアウトを(可能な限り)維持します。 の
デフォルトでは、物理レイアウト (列、ハイフネーションなど) を「元に戻し」、出力します。
読む順番に沿ったテキスト。
-修繕 数
指定された文字幅 (in) の固定ピッチ (または表形式) テキストを想定します。
ポイント)。 これにより、物理レイアウト モードが強制されます。
-生 テキストをコンテンツ ストリームの順序に保ちます。 これは列を「元に戻す」ことが多いハックです
raw モードの使用は推奨されなくなりました。
-htmlメタ
メタ情報を含む単純な HTML ファイルを生成します。 これは単純にラップします
テキスト入力そしてそしてメタヘッダーを先頭に追加します。
-bbox 内の各単語の境界ボックス情報を含む XHTML ファイルを生成します。
ファイルにソフトウェアを指定する必要があります。
-bbox-レイアウト
各ブロック、行、および境界ボックスの情報を含む XHTML ファイルを生成します。
ファイル内の単語。
-enc エンコード名
テキスト出力に使用するエンコーディングを設定します。 デフォルトは「UTF-8」です。
-聞く
利用可能なエンコーディングを点灯します
-エル UNIX | ドス | MAC
テキスト出力に使用する行末規則を設定します。
-nopgbrk
ページ間に改ページ (改ページ文字) を挿入しないでください。
-opw password
PDFファイルの所有者パスワードを指定します。 これを提供すると、すべてがバイパスされます
セキュリティ制限。
-upw password
PDFファイルのユーザーパスワードを指定します。
-q メッセージやエラーを印刷しないでください。
-v 著作権とバージョン情報を印刷します。
-h 使用情報を印刷します。 ((-助けて & - 助けて 同等です。)
onworks.net サービスを使用してオンラインで pdftotext を使用する