英语法语西班牙语

Ad


OnWorks 网站图标

适用于 Linux 的 pdfsandwich 下载

免费下载 pdfsandwich Linux 应用程序,以便在 Ubuntu online、Fedora online 或 Debian online 中在线运行

这是名为 pdfsandwich 的 Linux 应用程序,其最新版本可以作为 pdfsandwich-0.1.7.ta​​r.bz2 下载。 它可以在工作站的免费托管服务提供商 OnWorks 中在线运行。

使用 OnWorks 免费下载并在线运行这个名为 pdfsandwich 的应用程序。

请按照以下说明运行此应用程序:

- 1. 在您的 PC 中下载此应用程序。

- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。

- 3. 在这样的文件管理器中上传这个应用程序。

- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。

- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。

- 6. 下载应用程序,安装并运行。

pdf三明治


Ad


商品描述

pdfsandwich 生成“三明治”OCR pdf 文件,即仅包含图像(但没有可编辑文本)的 pdf 文件将通过光学字符识别 (OCR) 进行处理,并且文本将被添加到图像“背后”的每个页面中。

pdfsandwich 是一个命令行工具,应该对 OCR 扫描的书籍或期刊有用。 即使是多栏文本,它也能识别页面布局。

本质上,pdfsandwich 是一个包装脚本,它调用以下二进制文件:convert、unpaper、tesseract、gs 和 hocr2pdf(如果 tesseract < 3.03)。 众所周知,它可以在 Unix 系统上运行,并且已经在 Linux 和 MacOS X 上进行了测试。它支持在多处理器系统上进行并行处理。

与大多数竞争三明治程序相比,它对扫描图像进行预处理,例如去歪斜或去除暗边等。

更多信息请阅读手册: http://www.tobias-elze.de/pdfsandwich/index.html



目的

最终用户/桌面


用户界面

命令行


程式语言

OCaml(客观Caml)


分类目录

办公室/商业

这是一个也可以从 https://sourceforge.net/projects/pdfsandwich/ 获取的应用程序。 它已托管在 OnWorks 中,以便从我们的免费操作系统之一以最简单的方式在线运行。


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad