这是可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行的命令 unpaper,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
unpaper - 用于扫描纸张的后处理工具。
概要
无纸化 [选项] {输入模式 输出模式 | 输入文件 输出文件}
产品详情
unpaper 是扫描纸张的后处理工具,尤其是书页
从以前创建的影印件中扫描出来的。 主要目的是使
转换为 PDF 后,扫描的书页在屏幕上的可读性更好。 此外,
在执行光学操作之前,unpaper 可能有助于提高扫描页面的质量
字符识别 (OCR)。
unpaper 试图通过去除出现的暗边缘来清洁扫描图像
在实际页面内容之外的区域进行扫描或复印(例如
双面书页扫描的左侧和右侧)。 该程序
还尝试检测页面未对齐的居中和旋转,并将自动
通过将每一页旋转到正确的角度来拉直每一页。 这个过程叫做
“去歪斜”。 请注意,自动处理有时会失败。 它总是一个好
手动控制退纸结果和调整参数设置的想法
根据输入的要求。 每个处理步骤也可以禁用
每张纸单独。
输入和输出文件可以是 .pbm、.pgm 或 .ppm 格式,因此通常是 .pnm
格式,也被 Linux 扫描工具使用 扫描图像 和 扫描文件. 转换为 PDF
例如可以使用 Linux 工具实现 PGM2tiff, 争吵 和 tiff2pdf.
INPUT AND OUTPUT FILES
输入和输出文件需要通过使用模式或有序列表来设计
输入和输出文件; 如果使用了模式,例如 %04d,则将它们替换为
打开文件进行输入或输出之前的输入和输出表编号。
如果您不使用模式,则程序需要一或两个输入文件,具体取决于
什么被作为 --输入页面 以及一两个输出文件,具体取决于传递的内容
--输出页面, 为了。
缺少输出文件名是致命的,将停止处理; 缺少初始输入文件
名称是致命的,如果通过以下方式定义了一系列工作表,则任何丢失的输入文件也是致命的
- 床单 or --尾页.
无纸化 接受 PNM 格式的文件,这意味着它们可能是 .pbm、.pgm、.ppm 或 .pnm
格式,这是由 Linux 命令行扫描工具生成的,例如 扫描图像
和 扫描文件.
配置
-l { 单 | 翻番 | 没有 }, - 布局 { 单 | 翻番 | 没有 }
设置工作表的默认布局选项:
单
每张一页。
翻番
每张两页,横向(左半页一页,上一页
右半部分)。
没有
不能单独指定自动布局、掩模扫描点。
运用 单 or 翻番 自动设置对应 --掩码扫描点。 该
默认是 单.
-开始 片, --开始工作表 起始页
在多页模式下要处理的第一页数。 (默认值:1)
末端 片, --尾页 片
在多张模式下要处理的最后一张纸的数量。 -1 表示处理直到没有
更多具有相应页码的输入文件可用(默认值:-1)
-# 工作表范围, - 床单 工作表范围
(可选)指定在起始工作表和
终页。
-x 工作表范围, - 排除 工作表范围
在起始页和结束页之间的范围内从处理中排除页。
--预旋转 { -90 | 90 }
顺时针旋转整个图像(90) 或逆时针 (-90) 在任何其他之前
处理。
--后旋转 { -90 | 90 }
顺时针旋转整个图像(90) 或逆时针 (-90) 在任何其他
处理。
-M { v | h | 伏,小时 }, --预镜像 { v | h | 伏,小时 }
在可能的预旋转后镜像图像。 任何一个 v (用于垂直镜像), h
(用于水平镜像)或 伏,小时 (对于两者)可以指定。
--后镜 { v | h | 伏,小时 }
在除可能的后旋转之外的任何其他处理之后镜像图像。 任何一个 v
(用于垂直镜像), h (用于水平镜像)或 伏,小时 (对于两者)都可以
指定的。
--换班前 h,v
在进一步处理之前移动图像。 值 h (水平移动)和 v
(垂直位移)可以是正的也可以是负的。
-- 换班后 h,v
在其他处理后移动图像。 值 h (水平移动)和 v
(垂直位移)可以是正的也可以是负的。
--预擦除 左,最佳,右,底部
在进一步处理之前手动擦除一个区域。 擦除区域中的任何像素都将是
设置为白色。 可以通过多次出现来指定要擦除的多个区域
这个选项。
--后擦除 左,最佳,右,底部
处理后手动擦除一个区域。 擦除区域中的任何像素都将设置为
白色的。 多个要擦除的区域可以通过多次出现来指定
选项。
--预边界 左,最佳,右,底部
在进一步处理之前清除工作表的边界区域。 边框中的任何像素
区域将设置为白色。
-- 边境后 左,最佳,右,底部
其他处理后清除纸张的边框区域。 边框中的任何像素
区域将设置为白色。
--预掩码 x1,y1,x2,y2
指定在任何其他处理之前应用的掩码。 遮罩外的任何像素都将是
设置为白色,除非另一个蒙版包含此像素。
只有蒙版内的像素将保留。 可以指定多个掩码。 无纠偏
将应用于指定的掩码 --预掩码.
-s { 宽度,高度 | 尺寸名称 }, - 尺寸 { 宽度,高度 | 尺寸名称 }
在应用其他处理之前更改纸张尺寸。 工作表上的内容获取
缩放以适应适当的大小,但保留纵横比。 相反,如果
工作表的纵横比发生变化,缩放的内容在工作表上居中。
可能的值 尺寸名称 是: a5, a4, a3, 邮件, 法律. 所有尺寸名称也可以
应用于旋转横向,使用 a4-风景, 字母风景 等等
--后尺寸 { 宽度,高度 | 尺寸名称 }
在其他处理后更改纸张大小以保留内容的纵横比
应用步骤。
- 拉紧 { 宽度,高度 | 尺寸名称 }
在应用其他处理之前更改纸张尺寸。 工作表上的内容获取
拉伸到指定的大小,可能会改变纵横比。
--后拉伸 { 宽度,高度 | 尺寸名称 }
应用其他处理后更改纸张尺寸。 工作表上的内容获取
拉伸到指定的大小,可能会改变纵横比。
-z 因素, - 飞涨 因素
在完成其他处理之前,根据给定的因素更改纸张尺寸。
--放大后 因素
处理完成后,根据给定的因素更改纸张尺寸。
-bn { v | h | 伏,小时 }, --blackfilter-扫描方向 { v | h | 伏,小时 }
搜索纯黑色区域的方向。 任何一个 v (对于垂直
镜像), h (用于水平镜像)或 伏,小时 (对于两者)可以指定。
-bs { 尺寸 | h尺寸,v 尺寸 }, --blackfilter-扫描尺寸 { 尺寸 | h尺寸,v 尺寸 }
用于掩码检测的虚拟条的宽度。 可以指定两个值
单独设置水平和垂直大小。 (默认: 20,20)
-bd { 深度 | h-深度,深度 }, --blackfilter-扫描深度 { 深度 | h-深度,深度 }
用于黑色区域检测的虚拟条的大小。 (默认: 500,500)
-bp { 步 | h步,v步 }, --blackfilter-扫描步骤 { 步 | h步,v步 }
移动虚拟条以进行黑色区域检测的步骤。 (默认: 5,5)
-BT 门槛, --blackfilter-扫描阈值 门槛
检测到黑色区域的暗像素的比率。 (默认: 0.95).
-bx 左,最佳,右,底部, --blackfilter-扫描-排除 左,最佳,右,底部
黑过滤器不应操作的区域。 这有助于防止
blackfilter 处理内部页面内容。 可以多次指定设置
不止一个区域。
-双 强度, --blackfilter-强度 强度
删除黑色区域的强度。 较大的值会留下较少的噪点像素
围绕以前的黑色区域,但可能会删除页面内容。 (默认: 20)
-两者都不 强度, -噪声过滤器强度 强度
删除单个像素或微小像素簇的强度。 任何
只包含的集群 强度 暗像素一起将被删除。 (默认:
4)
-ls { 尺寸 | h尺寸,v 尺寸 }, --模糊滤镜大小 { 尺寸 | h尺寸,v 尺寸 }
用于搜索“孤立”像素簇的模糊过滤器区域的大小。 (默认: 100,100)
-lp { 步 | h步,v步 }, --模糊滤镜步骤 { 步 | h步,v步 }
每个方向的“模糊”步骤的大小。 (默认: 50,50)
-李 比, --blurfilter-强度 比
删除微小像素簇的相对强度。 任何模糊区域
其中最多包含 比 暗像素将被清除。 (默认: 0.01)
-gs { 尺寸 | h尺寸,v 尺寸 }, --grayfilter-尺寸 { 尺寸 | h尺寸,v 尺寸 }
用于搜索“仅灰色”像素区域的灰色过滤器蒙版的大小。 (默认: 50,50)
-gp { 步 | h步,v步 }, --灰度滤镜步骤 { 步 | h步,v步 }
在每个方向上移动灰度过滤器蒙版的步长大小。 (默认: 20,20)
-gt 比, --grayfilter-阈值 比
在清除灰色过滤器掩码之前接受的灰度的相对强度
在蒙版中没有发现黑色像素的情况下。 (默认: 0.5)
-p x,y, --掩码扫描点 x,y
手动设置掩码检测的起点。 多种的 --掩码扫描点 选项可能
指定检测多个掩码。
-m x1,y1,x2,y2, - 面具 x1,y1,x2,y2
手动添加口罩,除了自动检测周围的口罩
--掩码扫描点 坐标(除非 --无掩码扫描 指定)。
蒙版外的任何像素都将设置为白色,除非另一个蒙版覆盖了该像素。
-mn { v | h | 伏,小时 }, --掩码扫描方向 { v | h | 伏,小时 }
搜索掩码边界的方向,从 --mask-scan-point 开始
坐标。 任何一个 v (用于垂直镜像), h (用于水平镜像)或 伏,小时
(对于两者)可以指定。 (默认: h作为 v 可以在单页上剪切文本段落
床单)
-多发性硬化症 { 尺寸 | h尺寸,v 尺寸 }, --掩码扫描大小 { 尺寸 | h尺寸,v 尺寸 }
用于掩码检测的虚拟条的宽度。 可以指定两个值
单独设置水平和垂直大小。 (默认: 50,50)
-MD { 深度 | h-深度,深度 }, --掩码扫描深度 { 深度 | h-深度,深度 }
用于蒙版检测的虚拟条的高度。 (默认: -1,-1, 使用总
工作表的宽度或高度)
-mp { 步 | h步,v步 }, --掩码扫描步骤 { 步 | h步,v步 }
移动用于掩码检测的虚拟条的步骤。 (默认: 5,5)
-公吨 { 门槛 | h-阈值,v-阈值 }, --掩码扫描阈值 { 门槛 |
h-阈值,v-阈值 }
检测到边缘的暗像素相对于最大黑度的比率
当从起始坐标朝向一个边缘计数时。 (默认: 0.1)
-毫米 w,h, --掩模扫描最小 w,h
自动检测掩码的最小允许大小。 检测到低于此尺寸的口罩将是
忽略并设置为 mask-scan-maximum 指定的大小。 (默认: 100,100)
-毫米 w,h, --掩码扫描最大 w,h
自动检测掩码的最大允许大小。 检测到的大于此大小的掩码将是
收缩到最大值,每个方向单独。 (默认:纸张大小,或
页面大小源自 - 布局 选项)
-mc 颜色, --遮罩颜色 颜色
用于擦除未被任何遮罩覆盖的像素的颜色值。 也许有用
测试以可视化掩蔽的效果。 (请注意,RGB 值是
预期:R*65536 + G*256 + B。)
-dn { 左 | 最佳 | 右 | 底部 },..., --deskew-扫描方向 { 左 | 最佳 | 右 |
底部 },...
旋转扫描的边缘。 掩模的每个边缘都可用于检测
面具的旋转。 如果指定了多个边,将使用平均值,
除非统计偏差超过 --deskew-扫描偏差。 使用 左 HPMC胶囊
从左边缘扫描, 最佳 用于从顶部边缘扫描, 右 用于扫描
从右边缘, 底部 用于从底部扫描。 多个方向可以
被逗号隔开。 (默认: 左右)
-ds 像素, --deskew-扫描大小 像素
用于旋转检测的虚拟线的大小。 (默认: 1500)
-dd 比, --deskew-扫描深度 比
相对于扫描条,在扫描停止之前累积的暗像素量
尺寸。 (默认: 0.5)
-博士 度, --deskew-扫描范围 度
搜索旋转的范围,从 -度 到+度 回转。 (默认:
5.0)
-dp 度, --偏斜校正扫描步骤 度
单个旋转角度检测之间的步骤。 较低的数字导致更好的结果
但会减慢处理速度。 (默认: 0.1)
-dv 偏差, --deskew-扫描偏差 偏差
检测到的边缘结果之间允许的最大统计偏差。 不
如果超过旋转。 (默认: 1.0)
-W 左,最佳,右,底部, - 擦拭 左,最佳,右,底部
手动清除一个区域。 擦除区域中的任何像素都将设置为白色。 多种的
- 擦拭 可以指定区域。 这适用于纠偏之后和自动之前
边界扫描。
-兆瓦 { 尺寸 | 左,右 }, --中间擦拭 { 尺寸 | 左,右 }
If - 布局 被设置为 翻番,这可以指定要擦除的中间区域的大小
在纸张上的两页之间。 如果 blackfilter 失败,这可能很有用
去除一些黑色区域(例如由于在两个
页)。
-B 左,最佳,右,底部, - 边界 左,最佳,右,底部
手动添加边框。 边框区域中的任何像素都将设置为白色。 这是
在去歪斜之后和自动边界扫描之前应用。
-Bn { v | h | 伏,小时 }, --边界扫描方向 { v | h | 伏,小时 }
搜索外边界的方向。 任何一个 v (用于垂直镜像), h
(用于水平镜像)或 伏,小时 (对于两者)可以指定。 (默认: v)
-Bs { 尺寸 | h尺寸,v 尺寸 }, --边界扫描大小 { 尺寸 | h尺寸,v 尺寸 }
用于边界检测的虚拟条的宽度。 可以指定两个值
单独设置水平和垂直大小。 (默认: 5,5)
-BP { 步 | h步,v步 }, --边界扫描步骤 { 步 | h步,v步 }
移动虚拟条以进行边界检测的步骤。 (默认: 5,5)
-BT 门槛, --border-scan-阈值 门槛
边界扫描遮罩覆盖的暗像素的绝对数量,在该遮罩上方有一个边界
检测到。 (默认: 5)
-巴 { 左 | 最佳 | 右 | 底部 }, --边界对齐 { 左 | 最佳 | 右 | 底部 }
移动检测到的边界区域的方向。 用 --边框边距 指定
与板材边缘保持的水平和垂直距离。 (默认: 没有)
-Bm 垂直,横, --边框边距 垂直,横
对齐边框区域时与图纸边缘保持的距离。 可以使用测量
足够,例如厘米,英寸。
-w 门槛, --白阈值 门槛
亮度比,高于此像素被视为白色。 (默认: 0.9)
-b 门槛, --黑色阈值 门槛
低于此亮度的像素被视为黑色(非灰色)。 这是由
灰色过滤器。 该值也用于将灰度图像转换为
黑白模式(默认: 0.33)
-ip { 1 | 2 }, --输入页面 { 1 | 2 }
If 2 指定,读取两个输入图像而不是一个,并在内部将它们组合成
进一步加工前的双版面纸。 在内部合并之前,
--预旋转 可选地单独应用于两个输入图像作为非常
第一个处理步骤。
-操作 { 1 | 2 }, --输出页面 { 1 | 2 }
If 2 指定,作为分割一个的结果,写入两个输出图像而不是一个
加工后的双排版纸。 分页后, --旋转后 is
可选择单独应用于两个输出图像作为最后的处理
步。
-S { 宽度,高度 | 尺寸名称 }, --纸张大小 { 宽度,高度 | 尺寸名称 }
强制固定纸张大小。 通常,纸张大小由输入图像大小决定
(如果 输入页数=1),或按两页输入集中第一页的两倍大小
(如果 输入页数=2)。 如果输入图像小于此处指定的尺寸,则
将在工作表上居中显示并被白色边框包围。 如果输入
图像更大,它将居中,边缘将被裁剪。 此选项可能
如果输入图像大小不同,也有助于获得常规大小的输出图像。
标准尺寸名称,如 a4-风景, 邮件等可以使用(见 - 尺寸).
(默认:在输入文件中)
--工作表背景 { 黑色 | 白色 }
设置在加载任何图像之前填充纸张的颜色并将其放置到
它。 当纸张尺寸和图像尺寸不同时,这会很有用。
--无黑色滤镜 工作表范围
禁用黑色区域扫描。 可以指定单个工作表索引。
--无噪音过滤器 工作表范围
禁用噪声过滤器。 可以指定单个工作表索引。
--无模糊过滤器 工作表范围
禁用模糊过滤器。 可以指定单个工作表索引。
--无灰度滤镜 工作表范围
禁用灰色过滤器。 可以指定单个工作表索引。
--无掩码扫描 工作表范围
禁用掩码检测。 掩码明确设置 - 面具 还是会有效果的。
可以指定单个工作表索引。
--无掩模中心 工作表范围
禁用每个遮罩的自动居中。 默认情况下执行自动居中,如果
- 布局 选项已设置。 可以指定单个工作表索引。
--无偏斜 工作表范围
禁用偏移校正。 可以指定单个工作表索引。
--禁止擦拭 工作表范围
禁用显式擦除区域。 这意味着参数的影响 - 擦拭 可
每张纸单独禁用。
- 无边界 工作表范围
禁用显式设置边框。 这意味着参数的影响 - 边界 可
每张纸单独禁用。
--无边界扫描 工作表范围
禁用从纸张边缘进行边框扫描。 单个工作表索引可以是
指定的。
--无边界对齐 工作表范围
禁用对齐边界扫描检测到的区域(请参阅 --边界对齐).
可以指定单个工作表索引。
-n 工作表范围, --无处理 工作表范围
除了前/后旋转和镜像之外,不要对片材进行任何处理,并且
保存时的文件深度转换。 此选项与设置所有的效果相同
--no-xxx 选项一起。 可以指定单个工作表索引。
- 插 { 最近的 | 线性 | 立方体 }
设置用于去歪斜和拉伸的插值函数。 这 立方体 选项
提供最佳图像质量,同时 最近的 是最快的。 (默认: 立方体)
--无多页
即使输入文件名包含 %(通常是
指示页面计数器占位符的开始)。
--dpi DPI
用于转换测量尺寸值的每英寸点数,例如 21cm,27.9cm.
请注意,此参数应在指定任何大小值之前出现
度量后缀。 (默认: 300)
-t { PBM | PGM | ppm }, - 类型 { PBM | PGM> | ppm }
输出文件类型(和位深度)。 如果未指定,则具有相同或最接近的那个,
像素格式作为原始输入文件将被使用。
PBM
便携式位图,单色原始图像。
PGM
便携式灰度图,每像素 8 位灰度原始图像。
ppm
便携式像素图,每像素 24 位 RGB 原始图像。
-T, --仅测试
不要写任何输出。 结合使用可能有用 --详细 要得到
有关输入的信息。
-是的 nr, --开始输入 nr
设置第一个页码以替换输入文件名中的“%d”。 每次
输入文件序列被重复,这个数字增加 1。(默认:
(startsheet-1)*输入页+1)
-所以 nr, --开始输出 nr
设置第一个页码以替换输出文件名中的“%d”。 每次
输出文件序列被重复,这个数字增加 1。(默认:
(startsheet-1)*输出页+1)
--插入空白 nr [,nr...]
使用空白输入而不是来自指定输入文件序列的输入文件
索引位置。 输入文件序列将被暂时中断,并将
之后继续下一个输入文件。 这对于插入空白很有用
内容转换为一系列输入图像。
--替换空白 nr [,nr...]
喜欢 --插入空白,但指定索引位置的输入图像得到
替换为空白内容,因此将被忽略。
--覆盖
允许覆盖现有文件。 否则,如果出现错误,程序将终止
要写入的输出文件已存在。
-q, - 安静的
安静模式,根本没有输出。
-v, --详细
详细输出,更多信息消息。
-vv
更详细的输出,在处理前显示参数设置。
-V, - 版
输出版本和构建信息。
版权
使用 onworks.net 服务在线使用 unpaper
