这是 hocr2djvused 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
hocr2djvused - hOCR 到 已使用 脚本转换器
概要
hocr2djv使用 [选项...] [hocr 文件...]
商品描述
hocr2djvused 读取一个或多个 人格[1] 文件(由 章鱼[2]或 楔形的[3]或
正方体[4]) 并将它们转换为 已使用 脚本。
除非在命令行上明确提供文件名,否则 hOCR 将从
标准输入。
配置
文本 分割 选项
-t 线, - 细节 线
记录每一行的位置。 不要记录特定单词的位置或
字符。
-t 话, --details=单词
记录每一行和每个单词的位置。 不要记录特定的位置
字符。
这是默认设置。
-t 字符, --详细信息=字符
记录每一行、每个单词和每个字符的位置。
--word-segmentation=简单
将每个非空白字符的非空序列视为一个单词。
这是默认设置,尽管在语言上不正确。
--分词=uax29
使用 统一 文本 用户分类[5] 将行分成单词的算法。
这个选项打破了一些 DjVu 工具的假设,即单词用空格分隔,
因此不推荐。
其他名称 选项
--旋转=n
假设 DjVu 页面旋转了 n 度。
--页面大小=宽度x高度
指定页面大小为 宽度 像素 × 高度 像素。
此选项对于楔形文字 (< 0.8) 生成的 hOCR 是必需的,并且是多余的
除此以外。
--html5
使用 HTML5 解析器[6],它比默认解析器更健壮但速度更慢。
--修复utf8
尝试修复 UTF-8 编码问题并消除不需要的控制字符。
由 Cuneiform[7] 或 Tesseract[8] 生成的 hOCR 可能需要此选项。
- 版
输出版本信息并退出。
-h, - 帮帮我
显示帮助并退出。
使用 onworks.net 服务在线使用 hocr2djvused