GoGPT Best VPN GoSearch

Icône de favori OnWorks

djvuxml - En ligne dans le Cloud

Exécutez djvuxml dans le fournisseur d'hébergement gratuit OnWorks sur Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

Il s'agit de la commande djvuxml qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos nombreux postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

PROGRAMME:

Nom


djvutoxml, djvuxmlparser - Outils XML DjVuLibre.

SYNOPSIS


djvutoxml [Options] fichier djvu d'entrée [fichierxml de sortie]
analyseur djvuxml [ -o fichier djvu ] fichierxml d'entrée

DESCRIPTION


Les outils XML DjVuLibre permettent d'éditer les métadonnées, les hyperliens et le texte caché
associés aux fichiers DjVu. contrairement à djvu(1) les outils XML DjVuLibre reposent sur le XML
technologie et peut tirer parti des éditeurs et des vérificateurs XML.

DJVUTOXML


Programme djvutoxml crée un fichier XML fichierxml de sortie contenant une référence à l'original
Document DjVu fichier djvu d'entrée ainsi que des balises décrivant les métadonnées, les hyperliens et
texte caché associé au fichier DjVu.

Les options suivantes sont prises en charge :

--page numéro de page
Sélectionnez une page dans un document de plusieurs pages. Sans cette option, djvutoxml sort le
XML correspondant à toutes les pages du document.

--avec-texte
Spécifie le TEXTE CACHÉ élément pour chaque page doit être inclus dans la sortie.
Si spécifié sans le --avec-anno drapeau puis le --sans-anno est implicite. Si
aucun des --avec-texte, --sans-texte, --avec-anno, or --sans-anno, les drapeaux sont
spécifié, alors le --avec-texte et --avec-anno les drapeaux sont implicites.

--sans-texte
Spécifie de ne pas sortir le TEXTE CACHÉ élément pour chaque page. Si spécifié sans
le --sans-anno drapeau puis le --avec-anno drapeau est implicite.

--avec-anno
Spécifie la zone CARTE élément pour chaque page doit être inclus dans la sortie. Si
spécifié sans le --avec-texte drapeau puis le --sans-texte drapeau est implicite.

--sans-anno
Spécifie la zone CARTE L'élément de chaque page ne doit pas être inclus dans la sortie.
Si spécifié sans le --sans-texte drapeau puis le --avec-texte drapeau est implicite.

DJVUXMLPARSER


Fichiers produits par djvutoxml peut ensuite être modifié à l'aide d'un éditeur de texte ou d'un XML
éditeur. Programme analyseur djvuxml analyse le fichier XML fichierxml d'entrée afin de modifier le
métadonnées du fichier DjVu correspondant.

-o fichier djvu
En principe le fichier DjVu cible est le fichier référencé par le OBJET élément de
le fichier XML. Cette option permet de remplacer le nom de fichier spécifié dans
le OBJET .

DJVUXML DOCUMENT TYPE DÉFINITION


Le fichier de définition de type de document (DTD)

/usr/share/djvu/pubtext/DjVuXML-s.dtd

définit l'entrée et la sortie des outils XML DjVu.

La DTD DjVuXML-s est une simplification de la DTD HTML :

http://www.w3c.org/TR/1998/REC-html40-19980424/sgml/dtd.html

avec quelques nouveaux attributs ajoutés spécifiques à DjVu. Chacune des pages spécifiées d'un DjVu
document sont représentés comme OBJET éléments au sein de la BODY élément du fichier XML. Chaque
OBJET l'élément peut contenir plusieurs PARAMÈTRE éléments pour spécifier des attributs comme le nom de la page,
résolution et facteur gamma. Chaque OBJET élément peut également contenir un TEXTE CACHE
élément pour spécifier le texte caché (généralement généré avec un moteur OCR) dans le DjVu
page. De plus chaque OBJET l'élément peut faire référence à une seule zone CARTE élément qui
contient plusieurs Réservé éléments pour représenter tous les hyperliens et zones de surbrillance dans
le document DjVu.

PARAMÈTRE Éléments
Juridique PARAMÈTRE éléments d'un DjVu OBJET inclure mais ne sont pas limités à PAGE pour spécifier
le nom de la page, GAMME pour spécifier le facteur de correction gamma (normalement 2.2), et DPI
pour spécifier la résolution de la page.

TEXTE CACHÉ Éléments
Le manuel de formation TEXTE CACHÉ éléments se compose d'éléments imbriqués de PAGECOLONNES, RÉGION, PARAGRAPHE,
LIGNE, et WORD. L'élément le plus profondément imbriqué spécifié doit spécifier la limite
coordonnées de l'élément en orientation descendante. Le corps du plus profondément imbriqué
élément doit contenir le texte. La plupart des documents DjVu utilisent soit LINE or WORD car
élément de niveau le plus bas, mais tout élément est légal en tant qu'élément de niveau le plus bas. Un espace blanc
est toujours ajouté entre WORD éléments et un saut de ligne est toujours ajouté entre LINE
éléments. Étant donné que des langues telles que le japonais n'utilisent pas d'espaces entre les mots, il est tout à fait
commun pour les moteurs OCR asiatiques à utiliser WORD comme personnages à la place.

CARTE Éléments
Le corps de la CARTE les éléments se composent de Réservé éléments. En plus des attributs
répertorié dans

http://www.w3.org/TR/1998/REC-html40-19980424/struct/objects.html#edef-ZONE,

les attributs type de bordure, couleur de la bordure, frontièreet mettre en évidence ont été ajoutés pour préciser
le type de bordure, la couleur de la bordure, la largeur de la bordure et les couleurs de surbrillance respectivement. Valeurs légales
pour chacun de ces attributs sont répertoriés dans la DTD DjVuXML-s. De plus, la forme ovale
a été ajouté à la liste légale des formes. Un ovale utilise une boîte englobante rectangulaire.

Utilisez djvuxml en ligne avec les services onworks.net


Serveurs et postes de travail gratuits

Télécharger des applications Windows et Linux

Commandes Linux

Ad




×
Publicité
❤ ️Achetez, réservez ou achetez ici — gratuitement, contribue à maintenir la gratuité des services.