英语法语西班牙语

Ad


OnWorks 网站图标

hocr2djvused - 云端在线

在 OnWorks 免费托管服务提供商中通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器运行 hocr2djvused

这是 hocr2djvused 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


hocr2djvused - hOCR 到 已使用 脚本转换器

概要


hocr2djv使用 [选项...] [hocr 文件...]

商品描述


hocr2djvused 读取一个或多个 人格[1] 文件(由 章鱼[2]或 楔形的[3]或
正方体[4]) 并将它们转换为 已使用 脚本。

除非在命令行上明确提供文件名,否则 hOCR 将从
标准输入。

配置


文本 分割 选项
-t 线, - 细节 线
记录每一行的位置。 不要记录特定单词的位置或
字符。

-t , --details=单词
记录每一行和每个单词的位置。 不要记录特定的位置
字符。

这是默认设置。

-t 字符, --详细信息=字符
记录每一行、每个单词和每个字符的位置。

--word-segmentation=简单
将每个非空白字符的非空序列视为一个单词。

这是默认设置,尽管在语言上不正确。

--分词=uax29
使用 统一 文本 用户分类[5] 将行分成单词的算法。

这个选项打破了一些 DjVu 工具的假设,即单词用空格分隔,
因此不推荐。

其他名称 选项
--旋转=n
假设 DjVu 页面旋转了 n 度。

--页面大小=宽度x高度
指定页面大小为 宽度 像素 × 高度 像素。

此选项对于楔形文字 (< 0.8) 生成的 hOCR 是必需的,并且是多余的
除此以外。

--html5
使用 HTML5 解析器[6],它比默认解析器更健壮但速度更慢。

--修复utf8
尝试修复 UTF-8 编码问题并消除不需要的控制字符。

由 Cuneiform[7] 或 Tesseract[8] 生成的 hOCR 可能需要此选项。

- 版
输出版本信息并退出。

-h, - 帮帮我
显示帮助并退出。

使用 onworks.net 服务在线使用 hocr2djvused


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad