英语法语西班牙语

Ad


OnWorks 网站图标

djvu - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 djvu

这是 djvu 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


DjVu - DjVu 和 DjVuLibre.

引言


尽管 Internet 为我们提供了一个全球性的基础设施,可以在此基础上构建
万能图书馆,世界上大部分知识、历史和文学仍然被困
在世界传统图书馆地下室的纸上。 许多图书馆和内容
所有者正在将他们的藏品数字化。 虽然许多这样的努力
涉及将纸质文件转换为计算机友好形式的艰苦过程,
例如基于 SGML 的格式,这种转换的高成本限制了它们的范围。
扫描文档并以电子方式分发生成的图像不仅是
相当便宜,但也更忠实于原始文件,因为它保留了
它的视觉方面。

尽管网络连接和计算机的速度迅速提高,但
如今可在 Web 上访问的扫描文档图像相对较少。 有几种
原因。

第一个原因是扫描未装订的纸张以外的任何其他内容的成本相对较高
在黑色和白色。 这个问题随着快速和低效的出现而慢慢消失——
带进纸器的成本彩色扫描仪。

第二个原因是长期建立的图像压缩标准和文件格式
已证明不足以分发高分辨率的扫描文档,尤其是
彩色文档。 不仅文件大小和下载时间不切实际,解码
渲染时间也太长了。 以 100 度彩色扫描的典型杂志页面
JPEG 中的 dpi 通常会占用 100 KB 到 200 KB ,但文本几乎不会
可读性:不足以进行屏幕查看,完全不能用于打印。 相同
300 dpi 的页面质量足以查看和打印,但文件大小
最多 300 KB 到 1000 KB,这对于远程访问来说是不切实际的。 另一个专业
问题是完全解码的 300 dpi 彩色图像的信纸大小的页面占用 24 MB
内存不足,容易引起磁盘交换。

第三个原因是数字文档不仅仅是个人的集合
页面图像。 扫描文档中的页面具有自然的序列顺序。 特别规定
必须确保翻页是即时和毫不费力的,以便
保持良好的用户体验。 更重要的是,大多数现有的文档格式强制
用户在显示所选页面之前首先下载整个文档。 然而,
用户通常希望跳转到文档的各个页面,而无需等待
要下载的整个文档。 高效的浏览需要高效的随机页面访问,
快速连续翻页,快速渲染。 这可以通过
高级压缩、预取、预解码、缓存和渐进式的组合
渲染。 DjVu 将每个页面分解为多个组件(文本、背景、图像、
常见形状的库...),可能由多个页面共享并下载
要求。 所有这些要求都需要非常复杂但简洁的控制
处理按需下载、预取、解码、缓存和
页面图像的渐进式渲染。 这里正在考虑的不仅仅是一个
文档图像压缩技术,而是一个完整的文档传递平台。

DjVu 是一种图像压缩技术、一种文档格式和一种软件平台
通过 Internet 交付满足上述要求的文档图像。

DJVU 图像 压缩


DjVu 图像压缩基于三种技术:

DjVu相片
DjVuPhoto,也称为IW44,是一种基于小波的连续色调图像压缩
渐进式解码/渲染技术。 它最适合用于编码照片
彩色或深浅不一的灰色图像。 图像的大小通常是 JPEG 的一半
同样的失真。

DjVu双音调
DjVuBitonal,也称为 JB2,是一种双色调图像压缩,它利用了
在页面上重复几乎相同的形状(例如字符)以有效地
压缩文本图像。 最好用于压缩代表的黑白图像
文字和简单的图画。 DjVuBitonal 中典型的 300 dpi 页面占用 5 到 25 KB(3 到
比 TIFF-G8 或 PDF 好 4 倍)。

DjVu文档
DjVuDocument 是一种专为彩色数字文档设计的压缩技术
包含图片和文本的图像,例如杂志的页面。 DjVu文档
将图像表示为单独压缩的层。 前景层通常是
用 DjVu Bitonal 压缩并包含文本和绘图。 背景层是
通常用 DjVuPhoto 压缩并包含背景纹理和图片
较低的分辨率。

DJVU 文件 货品运送 平台


DjVu 技术从头开始设计,以支持高效交付
互联网上的数字文档。 它提供了多种方式来处理多页
文档,以及通过超链接、元数据、可搜索来丰富内容的各种方法
文字等

MIME 类型
DjVu 格式的官方 MIME 类型为 图像/vnd.djvu,这是首选
由 http 服务器为 DjVu 文件提供的内容类型。 使用的非官方 mime 类型
历史上是 图像/x.djvu图像/x-djvu,这可能仍然会遇到。 理想情况下,
客户端应配置为处理所有三个。 (有关 Web 服务器配置帮助,请参阅
http://www.djvuzone.org/support/tutorial/chapter-authoring1.html.)

捆绑 多页 文件
捆绑的多页 DjVu 文档使用单个文件来表示整个文档。
这个单个文件包含所有页面以及辅助信息(例如页面
目录、多个页面共享的数据、缩略图等)。 使用单一文件格式是
非常方便存储文件或发送电子邮件附件。

当您输入多页文档的 URL 时,DjVu 浏览器插件开始下载
整个文件,但会在第一页可用时立即显示。 你可以
使用 DjVu 工具栏立即导航到其他页面。 然而假设
文档存储在远程 Web 服务器上。 您可以轻松访问第一页并查看
这不是您想要的文件。 虽然你永远不会显示其他页面
浏览器正在为这些页面传输数据并浪费您的带宽
服务器(以及互联网的带宽)。 您还可以查看摘要
文档在第一页并跳转到第 100 页。但是直到第 100 页才能显示
已收到第 1 至 99 页的数据。 您可能需要等待传输
不必要的页面数据。 第二个问题(不必要的等待)可以使用
HTTP/1.1 协议的“字节服务”选项。 此选项必须得到支持
Web 服务器、代理、缓存和浏览器。 然而字节服务并没有解决
第一个问题(带宽的浪费)。

间接 多页 文件
间接多页 DjVu 文档解决了这两个问题。 间接多页 DjVu
文档由几个文件组成。 主文件被命名为索引文件。 你可以
使用索引文件的 URL 浏览文档,就像使用捆绑的多
页文件。 然而,索引文件非常小。 它只包含文档
目录和包含页面数据的辅助文件的 URL。 当你浏览一个
间接多页文档,浏览器只访问你所在页面的数据
观看。 这可以以合理的速度完成,因为浏览器维护
页面,有时会在当前页面之前预取几页。 该模型使用
网络服务带宽更有效。 它还消除了不必要的延迟
跳转到位于长文档中任意位置的页面时。

注释
每个 DjVu 图像都可以选择包含所谓的注释块。 注释块是
通常用于定义到其他文档页面或任意网页的超链接。
注释块还可以用于其他目的,例如设置初始查看
页面模式,定义突出显示区域,或存储有关页面的任意元数据
或文件。

老旧房屋 文本
每个 DjVu 图像都可以选择包含一个隐藏的文本层,该层与图形相关联
特征与相应的文本。 隐藏文本层通常由
运行光学字符识别软件。 此文本信息提供
索引 DjVu 文档并从 DjVu 页面图像复制/粘贴文本。

缩略图
DjVu 文档有时包含预先计算的页面缩略图。

Outline
DjVu 文档有时包含一个包含大纲的导航块,即
带有指向相应文档页面的指针的分层目录。

DJVZONE AND DJVULIBRE


DjVu 技术最初是由 AT&T 实验室的一些研究人员于 1995 年创建的
和 1999. Lizardtech, Inc. ( http://www.lizardtech.com ) 然后获得了商业广告
AT&T 的许可并继续开发。 他们现在有多种解决方案
使用 DjVu 技术制作和分发文档。

DjVuZone 网站 ( http://www.djvuzone.org ) 由少数 AT&T 实验室管理
最初创建 DjVu 技术的研究人员。 我们推广 DjVu
通过提供有关 DjVu 的独立信息来源来提供技术。

了解专有文档格式的空间有多小,Lizardtech
2000 年 XNUMX 月,在 GNU 公共许可证下发布了 DjVu 参考库。
库完全定义了压缩格式和基本的编解码器。 六个月
随后,Lizardtech 发布了更新的 DjVu 参考库以及源代码
Unix 查看器。

这两个版本构成了我们最初的 DjVuLibre 软件的基础。 我们修改了
构建系统以符合开源社区的期望。 各种bug
和便携性问题已得到修复。 我们还尝试使其更易于使用和
安装,同时保留 Lizardtech 版本的基本结构。

DjVuLibre 软件包含以下组件:

嗡嗡声(1) 一个通用的压缩命令行程序。 许多内部 DjVu 数据
使用这种技术压缩结构。

c44(1) DjVuPhoto 命令行编码器。 这种最先进的小波压缩器产生
来自 PPM 或 JPEG 图像的 DjVuPhoto 图像。

cjb2(1)
DjVuBitonal 命令行编码器。 这种软模式匹配压缩器产生
来自 PBM 图像的 DjVuBitonal 图像。 它可以无损地编码图像,或者
引入小的变化以提高压缩比。 无损
编码模式与 Lizardtech 商业编码器竞争。

卡帕杰武(1)
用于颜色较少的图像的 DjVuDocument 命令行编码器。 这个编码器是
非常适合压缩具有少量不同颜色的图像(例如
屏幕截图)。 主色由背景层编码。 另一个
颜色由前景层编码。

切塞普吉武(1)
用于分离图像的 DjVuDocument 命令行编码器。 这个编码器需要一个
包含预先分割的前景和背景图像的文件,并产生一个
DjVuDocument 图像。

迪杰武(1)
DjVu 图像的命令行解码器。 该程序生成 PNM 图像
以任何分辨率表示 DjVu 文档任何页面的任何部分。

播放器(1)
DjVu 图像的独立查看器。 这个复杂的查看器显示 DjVu
文件。 它实现了文档导航以及快速缩放和平移。

恩斯杰武(1)
用于查看 DjVu 图像的 Web 浏览器插件。 这个小插件允许查看
来自 Web 浏览器的 DjVu 文档。 它内部使用 djview 来执行实际的
工作。

djvups(1)
用于将 DjVu 文档转换为 PostScript 的命令行工具。

虚拟机(1)
用于操作捆绑的多页 DjVu 文档的命令行工具。 这个
程序通常用于收集单个页面并生成捆绑文档。

DJVMCVT(1)
用于将捆绑文档转换为间接文档的命令行工具和
反过来。

已使用(1)
一个强大的命令行工具,用于操作多页文档、创建或
编辑注释块,创建或编辑隐藏的文本层,预计算
缩略图等...

djvutx 文件(1)
从 DjVu 文档中提取隐藏文本的命令行工具。

转储(1)
用于检查 DjVu 文件并显示其内部的命令行工具
结构。

djvue提取(1)
用于反汇编 DjVu 图像文件的命令行工具。

djvmake(1)
用于组装 DjVu 图像文件的命令行工具。

用户名(1)
用于动态生成间接多页 DjVu 文档的 CGI 程序。

djvutoxml(1) djvuxml解析器(1)
将 DjVu 元数据编辑为 XML 文件的命令行工具。

DJVU 编码器 AND 任意2DJVU


DjVuLibre 带有各种专用编码器, c44(1) 对于摄影图像,
cjb2(1) 对于双色调图像,以及 卡帕杰武(1) 对于几乎没有不同颜色的图像。 虽然
这些编码器在其专业领域表现良好,无法处理复杂的任务
涉及分割和多页编码。

Lizardtech 商业产品(见 http://www.lizardtech.com/solutions/document) 能够
执行这些复杂的编码任务

另一种解决方案是由压缩服务器提供的 (http://any2djvu.djvuzone.org).
这台机器使用 AT&T 实验室的 pre-lizardtech 原型编码器,性能几乎与
以及商业 Lizardtech 编码器。 请注意 Any2DjVu 压缩
服务器不提供任何保证,不采取任何措施来确保您的文档将
保持机密,并且只有一台计算机在为整个地球工作。

鸣谢


在过去的五年中,许多人为 DjVu 源代码做出了贡献。
请提交 sourceforge 错误报告以更新以下列表。

Yoshua Bengio、莱昂·博图、Chakradhar Chandaluri、瑞吉斯·卓别林、陈明、Parag
Deshmukh、Royce Edwards、Andrew Erofeev、Praveen Guduru、Patrick Haffner、Paul G.
霍华德、奥兰多·凯斯、雅恩·勒库恩、阿尔乔姆·米赫耶夫、弗洛林·尼萨、约瑟夫·M·奥罗斯特、
史蒂文·皮格、比尔·里默斯、帕特里斯·西马德、杰弗里·特里格斯、卢克·文森特、帕斯卡
文森特

使用 onworks.net 服务在线使用 djvu


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad