这是 pdftotext 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
pdftotext - 便携式文档格式 (PDF) 到文本转换器(版本 3.03)
概要
pdftotext [选项] [PDF文件 [文本文件]]
商品描述
转文字 将便携式文档格式 (PDF) 文件转换为纯文本。
Pdftotext读取PDF文件, PDF文件,并写入一个文本文件, 文本文件。 如果 文本文件
未指定,pdftotext 转换 文件.pdf 至 文件.txt。 如果 文本文件 是'-',文本
发送到标准输出。
配置
-f 数
指定要转换的第一页。
-l 数
指定要转换的最后一页。
-r 数
以 DPI 为单位指定分辨率。 默认值为 72 DPI。
-x 数
指定裁剪区域左上角的 x 坐标
-y 数
指定裁剪区域左上角的 y 坐标
-W 数
以像素为单位指定裁剪区域的宽度(默认为 0)
-H 数
以像素为单位指定裁剪区域的高度(默认为 0)
-布局
保持(尽可能好)文本的原始物理布局。 这
默认是“撤消”物理布局(列、连字符等)并输出
文本按阅读顺序排列。
-固定 数
假设固定间距(或表格)文本,具有指定的字符宽度(在
分)。 这会强制使用物理布局模式。
-生的 保持文本内容流顺序。 这是一个经常“撤消”列的黑客
格式化等。不再推荐使用原始模式。
-html元
生成一个简单的 HTML 文件,包括元信息。 这只是包装
文本输入和并预先添加元标题。
-bbox 生成包含边界框信息的 XHTML 文件中的每个单词
文件中。
-bbox-布局
生成一个 XHTML 文件,其中包含每个块、行、
和文件中的单词。
-enc 编码名称
设置用于文本输出的编码。 这默认为“UTF-8”。
-听
点亮可用的编码
-停产 UNIX | DOS | MAC
设置用于文本输出的行尾约定。
-nopgbrk
不要在页面之间插入分页符(换页符)。
-opw 密码
指定 PDF 文件的所有者密码。 提供这将绕过所有
安全限制。
-upw 密码
指定 PDF 文件的用户密码。
-q 不要打印任何消息或错误。
-v 打印版权和版本信息。
-h 打印使用信息。 (-救命 和 - 帮帮我 是等价的。)
使用 onworks.net 服务在线使用 pdftotext