djvu - En ligne dans le Cloud

Il s'agit de la commande djvu qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

PROGRAMME:

Nom


DjVu - DjVu et DjVuLibre.

INTRODUCTION


Bien qu'Internet nous ait donné une infrastructure mondiale sur laquelle construire le
bibliothèque universelle, une grande partie de la connaissance, de l'histoire et de la littérature mondiale est toujours piégée
sur papier dans les sous-sols des bibliothèques traditionnelles du monde. De nombreuses bibliothèques et contenus
les propriétaires sont en train de numériser leurs collections. Alors que de nombreux efforts de ce type
impliquent le processus minutieux de conversion des documents papier en une forme informatique,
tels que les formats basés sur SGML, le coût élevé de telles conversions limite leur étendue.
La numérisation de documents et la distribution électronique des images résultantes ne sont pas seulement
nettement moins cher, mais aussi plus fidèle au document original car il préserve
son aspect visuel.

Malgré l'amélioration rapide de la vitesse des connexions réseau et des ordinateurs, le nombre de
images de documents numérisés accessibles sur le Web aujourd'hui est relativement petite. Il y a plusieurs
raisons à cela.

La première raison est le coût relativement élevé de la numérisation de tout autre chose que des feuilles non reliées
en noir et blanc. Ce problème disparaît lentement avec l'apparition de
scanners couleur avec chargeurs de feuilles.

La deuxième raison est que les normes de compression d'images et les formats de fichiers établis de longue date
se sont révélés insuffisants pour diffuser des documents numérisés à haute résolution, en particulier
documents en couleur. Non seulement la taille des fichiers et les temps de téléchargement sont peu pratiques, le décodage
et les temps de rendu sont également prohibitifs. Une page de magazine type numérisée en couleur à 100
dpi en JPEG occuperait généralement de 100 Ko à 200 Ko , mais le texte serait à peine
lisible : insuffisant pour la visualisation à l'écran et totalement inacceptable pour l'impression. Le même
page à 300 dpi aurait une qualité suffisante pour la visualisation et l'impression, mais la taille du fichier
serait de 300 Ko à 1000 Ko au mieux, ce qui est peu pratique pour un accès à distance. Un autre grand
le problème est qu'une image couleur 300 dpi entièrement décodée d'une page au format lettre occupe 24 Mo
de mémoire et provoque facilement l'échange de disque.

La troisième raison est que les documents numériques sont plus qu'une simple collection de données individuelles
images de pages. Les pages d'un document numérisé ont un ordre de série naturel. Provision SPECIALE
doit être fait pour s'assurer que le retournement des pages est instantané et sans effort afin de
maintenir une bonne expérience utilisateur. Plus important encore, la plupart des formats de documents existants imposent
aux utilisateurs de télécharger d'abord l'intégralité du document avant d'afficher une page choisie. Cependant,
les utilisateurs veulent souvent sauter aux pages individuelles du document sans attendre la
document entier à télécharger. Une navigation efficace nécessite un accès aléatoire efficace aux pages,
retournement de page séquentiel rapide et rendu rapide. Ceci peut être réalisé avec un
combinaison de compression avancée, pré-extraction, pré-décodage, mise en cache et progressive
le rendu. DjVu décompose chaque page en plusieurs composants (texte, arrière-plans, images,
bibliothèques de formes communes...) qui peuvent être partagées par plusieurs pages et téléchargées sur
demande. Toutes ces exigences appellent un contrôle très sophistiqué mais parcimonieux
mécanisme pour gérer le téléchargement à la demande, la pré-extraction, le décodage, la mise en cache et
rendu progressif des images de la page. Ce qui est envisagé ici n'est pas seulement une
technique de compression d'image de document, mais toute une plate-forme pour la livraison de documents.

DjVu est une technique de compression d'images, un format de document et une plate-forme logicielle pour
fournir des images de documents sur Internet qui remplissent les conditions ci-dessus.

DJVU IMAGE COMPRESSION


La compression d'images DjVu repose sur trois technologies :

DjVuPhoto
DjVuPhoto, également connu sous le nom d'IW44, est une compression d'image à tons continus basée sur des ondelettes
technique avec décodage/rendu progressif. Il est mieux utilisé pour l'encodage photographique
images en couleurs ou en nuances de gris. Les images sont généralement la moitié de la taille JPEG pour le
même distorsion.

DjVuBitonal
DjVuBitonal, également connu sous le nom de JB2, est une compression d'image bitonale qui tire parti de
répétitions de formes presque identiques sur la page (comme des caractères) pour
compresser des images de texte. Il est préférable de l'utiliser pour compresser des images en noir et blanc représentant
texte et dessins simples. Une page typique de 300 dpi dans DjVuBitonal occupe 5 à 25 Ko (3 à
8 fois mieux que TIFF-G4 ou PDF ).

DjVuDocument
DjVuDocument est une technique de compression spécialement conçue pour les documents numériques couleur
des images contenant à la fois des images et du texte, comme une page d'un magazine. DjVuDocument
représente les images en couches compressées séparément. La couche de premier plan est généralement
compressé avec DjVu Bitonal et contient le texte et les dessins. La couche d'arrière-plan est
généralement compressé avec DjVuPhoto et contient la texture de fond et les images à
résolution inférieure.

DJVU DOCUMENT LIVRAISON PLATEFORME


La technologie DjVu est conçue dès le départ pour prendre en charge la livraison efficace de
documents numériques sur Internet. Il propose différentes manières de gérer les pages multipages
documents, et diverses façons d'enrichir le contenu avec des liens hypertexte, des métadonnées, consultables
texte, etc...

MIME types
Le format DjVu a un type MIME officiel de image/vnd.djvu, qui est le préféré
type de contenu à donner par les serveurs http pour les fichiers DjVu. Types de mime non officiels utilisés
sont historiquement image/x.djvu et image/x-djvu, qui peut encore être rencontré. Idéalement,
les clients doivent être configurés pour gérer les trois. (Pour obtenir de l'aide sur la configuration du serveur Web, consultez
http://www.djvuzone.org/support/tutorial/chapter-authoring1.html.)

Groupé plusieurs pages INSTITUTIONNELS
Le document DjVu groupé de plusieurs pages utilise un seul fichier pour représenter l'ensemble du document.
Ce fichier unique contient toutes les pages ainsi que des informations annexes (par exemple la page
répertoire, données partagées par plusieurs pages, vignettes, etc.). L'utilisation d'un seul format de fichier est
très pratique pour stocker des documents ou pour envoyer des pièces jointes à des e-mails.

Lorsque vous tapez l'URL d'un document de plusieurs pages, le plugin du navigateur DjVu commence le téléchargement
tout le fichier, mais affiche la première page dès qu'elle est disponible. Vous pouvez
accédez immédiatement à d'autres pages à l'aide de la barre d'outils DjVu. Supposons cependant que le
document est stocké sur un serveur Web distant. Vous pouvez facilement accéder à la première page et voir
que ce n'est pas le document que vous vouliez. Bien que vous n'afficherez jamais les autres pages
le navigateur transfère des données pour ces pages et gaspille la bande passante de votre
serveur (et la bande passante d'Internet aussi). Vous pouvez également consulter le résumé de la
document sur la première page et passez à la page 100. Mais la page 100 ne peut pas être affichée tant que
les données des pages 1 à 99 ont été reçues. Vous devrez peut-être attendre la transmission de
données de page inutiles. Ce deuxième problème (l'attente inutile) peut être résolu en utilisant le
Options de ``service d'octets'' du protocole HTTP/1.1. Cette option doit être prise en charge par le
serveur web, les proxys, les caches et le navigateur. Le service d'octets ne résout cependant pas
le premier problème (le gaspillage de bande passante).

Indirect plusieurs pages INSTITUTIONNELS
Les documents DjVu multipages indirects résolvent les deux problèmes. Un DjVu multipage indirect
document est composé de plusieurs fichiers. Le fichier principal est nommé fichier d'index. Vous pouvez
parcourir un document en utilisant l'URL du fichier d'index, comme vous le faites avec un multi-
document de pages. Le fichier d'index est cependant très petit. Il contient simplement le document
répertoire et les URL des fichiers secondaires contenant les données de la page. Lorsque vous parcourez un
document indirect de plusieurs pages, le navigateur n'accède aux données que pour les pages que vous
visualisation. Cela peut être fait à une vitesse raisonnable car le navigateur maintient un cache de
pages et pré-extrait parfois quelques pages avant la page en cours. Ce modèle utilise
le Web servant la bande passante beaucoup plus efficacement. Il élimine également les retards inutiles
lorsque vous passez à des pages situées n'importe où dans un long document.

Annotations
Chaque image DjVu inclut en option des fragments d'annotation. Le bloc d'annotation est
souvent utilisé pour définir des hyperliens vers d'autres pages de document ou vers des pages Web arbitraires.
Les morceaux d'annotation peuvent également être utilisés à d'autres fins telles que la définition de l'affichage initial
mode d'une page, définir des zones en surbrillance ou stocker des métadonnées arbitraires sur la page
ou le document.

caché texte
Chaque image DjVu inclut éventuellement une couche de texte masquée associée à des graphiques
caractéristiques avec le texte correspondant. Le calque de texte masqué est généralement généré par
exécuter un logiciel de reconnaissance optique de caractères. Cette information textuelle fournit
indexation de documents DjVu et copier/coller de texte à partir d'images de pages DjVu.

Miniatures
Les documents DjVu contiennent parfois des vignettes de pages pré-calculées.

contour
Les documents DjVu contiennent parfois un morceau de navigation contenant un aperçu, c'est-à-dire un
table des matières hiérarchique avec des pointeurs vers les pages de document correspondantes.

DJVUZONE ET DJVULIBRE


La technologie DjVu a été initialement créée par quelques chercheurs d'AT&T Labs entre 1995
et 1999. Lizardtech, Inc. ( http://www.lizardtech.com ) a ensuite obtenu une licence commerciale
licence d'AT&T et a poursuivi le développement. Ils ont maintenant une variété de solutions pour
produire et diffuser des documents à l'aide de la technologie DjVu.

Le site web DjVuZone ( http://www.djvuzone.org ) est géré par les quelques AT&T Labs
chercheurs qui ont créé la technologie DjVu en premier lieu. Nous faisons la promotion du DjVu
technologie en fournissant une source indépendante d'informations sur DjVu.

Comprenant à quel point il y a peu de place pour un format de document propriétaire, Lizardtech
a publié la bibliothèque de référence DjVu sous la licence publique GNU en décembre 2000. Cette
La bibliothèque définit entièrement le format de compression et les codecs élémentaires. Six mois
plus tard, Lizardtech a publié une bibliothèque de référence DjVu mise à jour ainsi que le code source de
le visualiseur Unix.

Ces deux versions forment la base de notre logiciel DjVuLibre initial. Nous avons modifié le
système de build pour se conformer aux attentes de la communauté open source. Divers bugs
et les problèmes de portabilité ont été corrigés. Nous avons également essayé de le rendre plus simple à utiliser et
installer, tout en préservant la structure essentielle des versions Lizardtech.

Le logiciel DjVuLibre contient les composants suivants :

bzz(1) Un programme de ligne de commande de compression à usage général. De nombreuses données DjVu internes
les structures sont compressées à l'aide de cette technique.

c44(1) Un encodeur de ligne de commande DjVuPhoto. Ce compresseur à ondelettes de pointe produit
Images DjVuPhoto à partir d'images PPM ou JPEG.

Cjb2(1)
Un encodeur de ligne de commande DjVuBitonal. Ce compresseur à configuration souple produit
Images DjVuBitonal à partir d'images PBM. Il peut encoder des images sans perte, ou
introduire de petits changements afin d'améliorer le taux de compression. Le sans perte
le mode d'encodage est compétitif avec celui des encodeurs commerciaux Lizardtech.

cpaldjvu(1)
Un encodeur en ligne de commande DjVuDocument pour les images avec peu de couleurs. Cet encodeur est
bien adapté à la compression d'images avec un petit nombre de couleurs distinctes (par exemple
captures d'écran). La couleur dominante est codée par le calque d'arrière-plan. L'autre
les couleurs sont codées par la couche de premier plan.

csepdjvu(1)
Un encodeur en ligne de commande DjVuDocument pour les images séparées. Cet encodeur prend une
contenant des images de premier plan et d'arrière-plan pré-segmentées et produit un
Image DjVuDocument.

djvu(1)
Un décodeur en ligne de commande pour les images DjVu. Ce programme produit une image PNM
représentant n'importe quel segment de n'importe quelle page d'un document DjVu à n'importe quelle résolution.

djview(1)
Une visionneuse autonome pour les images DjVu. Cette visionneuse sophistiquée affiche DjVu
documents. Il implémente la navigation dans les documents ainsi que le zoom et le panoramique rapides.

nsdéjavu(1)
Un plugin de navigateur Web pour visualiser les images DjVu. Ce petit plugin permet de visualiser
Documents DjVu à partir de navigateurs Web. Il utilise en interne djview pour effectuer le réel
.

djvup(1)
Un outil de ligne de commande pour convertir des documents DjVu en PostScript .

DJVM(1)
Un outil en ligne de commande pour manipuler des documents DjVu groupés de plusieurs pages. Cette
est souvent utilisé pour collecter des pages individuelles et produire un document groupé.

djvmcvt(1)
Un outil de ligne de commande pour convertir des documents groupés en documents indirects et
inversement.

djvu(1)
Un outil de ligne de commande puissant pour manipuler des documents de plusieurs pages, créer ou
modification de morceaux d'annotation, création ou modification de calques de texte masqués, pré-calcul
vignettes, et plus encore...

djvutxt(1)
Un outil en ligne de commande pour extraire le texte caché des documents DjVu.

DjVudump(1)
Un outil en ligne de commande pour inspecter les fichiers DjVu et afficher leurs fichiers internes
structure.

extrait djvue(1)
Un outil en ligne de commande pour désassembler les fichiers image DjVu.

DJVUMAKE(1)
Un outil en ligne de commande pour assembler des fichiers image DjVu.

djvuserve(1)
Un programme CGI pour générer des documents DjVu multipages indirects à la volée.

djvutoxml(1), analyseur djvuxml(1)
Outils de ligne de commande pour éditer les métadonnées DjVu sous forme de fichiers XML.

DJVU ENCODEUR ET ANY2DJVU


DjVuLibre est livré avec une variété d'encodeurs spécialisés, c44(1) pour les images photographiques,
Cjb2(1) pour les images à deux tons, et cpaldjvu(1) pour les images avec peu de couleurs distinctes. Même si
ces encodeurs fonctionnent bien dans leur domaine spécialisé, ils ne peuvent pas gérer des tâches complexes
impliquant la segmentation et l'encodage multipage.

Les produits commerciaux Lizardtech (voir http://www.lizardtech.com/solutions/document) Peut
effectuer ces tâches d'encodage complexes

Une autre solution est fournie par le serveur de compression à l'adresse (http://any2djvu.djvuzone.org).
Cette machine utilise des encodeurs prototypes pré-lizardtech d'AT&T Labs et fonctionne presque aussi
ainsi que les encodeurs commerciaux Lizardtech. Veuillez noter que la compression Any2DjVu
serveur est livré sans garantie, que rien n'est fait pour s'assurer que vos documents seront
restent confidentiels, et qu'il n'y a qu'un seul ordinateur qui fonctionne pour toute la planète.

CRÉDITS


De nombreuses personnes ont contribué au code source de DjVu au cours des cinq dernières années.
Veuillez soumettre un rapport de bogue sourceforge pour mettre à jour la liste suivante.

Yoshua Bengio, Léon Bottou, Chakradhar Chandaluri, Regis M. Chaplin, Ming Chen, Parag
Deshmukh, Royce Edwards, Andrew Erofeev, Praveen Guduru, Patrick Haffner, Paul G.
Howard, Orlando Keise, Yann Le Cun, Artem Mikheev, Florin Nicsa, Joseph M. Orost,
Steven Pigeon, Bill Riemers, Patrice Simard, Jeffery Triggs, Luc Vincent, Pascal
Vincent.

Utiliser djvu en ligne en utilisant les services onworks.net



Derniers programmes en ligne Linux et Windows