Dit is het commando djvutoxml dat kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator
PROGRAMMA:
NAAM
djvutoxml, djvuxmlparser - DjVuLibre XML-tools.
KORTE INHOUD
djvutoxml [opties] invoerdjvubestand [outputxmlbestand]
djvuxmlparser [ -o djvu-bestand ] invoerxmlbestand
PRODUCTBESCHRIJVING
De DjVuLibre XML Tools zorgen voor het bewerken van de metadata, hyperlinks en verborgen tekst
geassocieerd met DjVu-bestanden. in tegenstelling tot djvused(1) de DjVuLibre XML Tools vertrouwen op de XML
technologie en kunnen profiteren van XML-editors en verifiers.
DJVUTOXML
Programma djvutoxml maakt een XML-bestand aan outputxmlbestand met een verwijzing naar het origineel
DjVu-document invoerdjvubestand evenals tags die de metadata beschrijven, hyperlinks en
verborgen tekst die is gekoppeld aan het DjVu-bestand.
De volgende opties worden ondersteund:
--bladzijde paginanummer
Selecteer een pagina in een document met meerdere pagina's. Zonder deze optie, djvutoxml voert de
XML die overeenkomt met alle pagina's van het document.
--met-tekst
Specificeert het VERBORGEN TEKST element voor elke pagina moet worden opgenomen in de uitvoer.
Indien opgegeven zonder de --met-anno vlag dan de --zonder-anno wordt geïmpliceerd. Indien
geen van de --met-tekst, --zonder-tekst, --met-anno, or --zonder-anno, vlaggen zijn
opgegeven, dan is de --met-tekst en --met-anno vlaggen worden geïmpliceerd.
--zonder-tekst
Specificeert om de . niet uit te voeren VERBORGEN TEKST element voor elke pagina. Indien gespecificeerd zonder
de --zonder-anno vlag dan de --met-anno vlag wordt geïmpliceerd.
--met-anno
Specificeert het gebied MAP element voor elke pagina moet worden opgenomen in de uitvoer. Indien
gespecificeerd zonder de --met-tekst vlag dan de --zonder-tekst vlag wordt geïmpliceerd.
--zonder-anno
Specificeert het gebied MAP element voor elke pagina mag niet worden opgenomen in de uitvoer.
Indien opgegeven zonder de --zonder-tekst vlag dan de --met-tekst vlag wordt geïmpliceerd.
DJVUXMLPARSER
Bestanden geproduceerd door djvutoxml kan vervolgens worden gewijzigd met behulp van een teksteditor of een XML
editor. Programma djvuxmlparser parseert het XML-bestand invoerxmlbestand om de te wijzigen
metadata van het bijbehorende DjVu-bestand.
-o djvu-bestand
In principe is het doel DjVu-bestand het bestand waarnaar wordt verwezen door de VOORWERP element van
het XML-bestand. Deze optie biedt de mogelijkheid om de bestandsnaam opgegeven in
de VOORWERP element.
DJVUXML DOCUMENT TYPE DEFINITIE
Het documenttypedefinitiebestand (DTD)
/usr/share/djvu/pubtext/DjVuXML-s.dtd
definieert de invoer en uitvoer van de DjVu XML-tools.
De DjVuXML-s DTD is een vereenvoudiging van de HTML DTD:
http://www.w3c.org/TR/1998/REC-html40-19980424/sgml/dtd.html
met een paar nieuwe attributen die specifiek voor DjVu zijn toegevoegd. Elk van de gespecificeerde pagina's van een DjVu
document worden weergegeven als VOORWERP elementen binnen de LICHAAM element van het XML-bestand. Elk
VOORWERP element kan meerdere bevatten PARAM elementen om attributen zoals paginanaam,
resolutie en gammafactor. Elk VOORWERP element kan ook één bevatten VERBORGENTEKST
element om de verborgen tekst te specificeren (meestal gegenereerd met een OCR-engine) binnen de DjVu
bladzijde. Bovendien elke VOORWERP element kan verwijzen naar een enkel gebied MAP element dat
bevat meerdere GEBIED elementen om alle hyperlinks weer te geven en gebieden binnen te markeren
het DjVu-document.
PARAM Elementen
Juridisch PARAM elementen van een DjVu VOORWERP omvatten, maar zijn niet beperkt tot: PAGINA voor het specificeren
de paginanaam, Gamma voor het specificeren van de gammacorrectiefactor (normaal 2.2), en DPI
voor het specificeren van de paginaresolutie.
VERBORGEN TEKST Elementen
De VERBORGEN TEKST elementen bestaat uit geneste elementen van PAGINAKOLOMMEN, REGIO, PARAGRAAF,
LIJN, en WOORD. Het diepst geneste element dat is opgegeven, moet de begrenzing specificeren
coördinaten van het element in top-down oriëntatie. Het lichaam van de diepst genestelde
element moet de tekst bevatten. De meeste DjVu-documenten gebruiken ofwel LINE or WOORD de
element op het laagste niveau, maar elk element is legaal als het element op het laagste niveau. Een witte ruimte
wordt altijd toegevoegd tussen WOORD elementen en een regelinvoer wordt altijd toegevoegd tussen LINE
elementen. Aangezien talen zoals het Japans geen spaties tussen woorden gebruiken, is het nogal
gebruikelijk voor Aziatische OCR-engines om te gebruiken WOORD in plaats daarvan als karakters.
MAP Elementen
Het lichaam van de MAP elementen bestaan uit GEBIED elementen. Naast de attributen
opgenomen in
http://www.w3.org/TR/1998/REC-html40-19980424/struct/objects.html#edef-GEBIED,
de attributen grenstype, rand kleur, grens en markeren zijn toegevoegd om te specificeren
randtype, randkleur, randbreedte en markeerkleuren respectievelijk. Wettelijke waarden
voor elk van deze attributen worden vermeld in de DjVuXML-s DTD. Bovendien is de vorm ovaal
is toegevoegd aan de wettelijke lijst van vormen. Een ovaal gebruikt een rechthoekig begrenzingsvak.
Gebruik djvutoxml online met behulp van onworks.net-services