Це команда djvuxml, яку можна запустити у безкоштовного хостинг-провайдера OnWorks за допомогою однієї з наших безкоштовних онлайн-робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS
ПРОГРАМА:
ІМ'Я
djvutoxml, djvuxmlparser - інструменти DjVuLibre XML.
СИНТАКСИС
djvutoxml [опції] вхідний файл djvu [вихідний xmfile]
djvuxmlparser [ -o djvufile ] inputxmfile
ОПИС
Інструменти DjVuLibre XML забезпечують редагування метаданих, гіперпосилань і прихованого тексту
пов'язані з файлами DjVu. На відміну від djvused(1) Інструменти DjVuLibre XML покладаються на XML
технологію і може скористатися перевагами редакторів і верифікаторів XML.
DJVUTOXML
програма djvutoxml створює файл XML вихідний xmfile що містить посилання на оригінал
Документ DjVu вхідний файл djvu а також теги, що описують метадані, гіперпосилання та
прихований текст, пов’язаний з файлом DjVu.
Підтримуються такі параметри:
--сторінка номер сторінки
Виберіть сторінку в багатосторінковому документі. Без цієї опції, djvutoxml виводить
XML, що відповідає всім сторінкам документа.
--з текстом
Визначає ПРИХОВАНИЙ ТЕКСТ елемент для кожної сторінки слід включити у вихідні дані.
Якщо вказано без --з-анно прапор потім --без анно мається на увазі. Якщо
жоден з --з текстом, --без тексту, --з-анно, or --без анно, прапори
вказано, то --з текстом та --з-анно маються на увазі прапори.
--без тексту
Вказує не виводити ПРИХОВАНИЙ ТЕКСТ елемент для кожної сторінки. Якщо вказано без
--без анно прапор потім --з-анно мається на увазі.
--з-анно
Вказує область MAP елемент для кожної сторінки слід включити у вихідні дані. Якщо
зазначено без --з текстом прапор потім --без тексту мається на увазі.
--без анно
Вказує область MAP елемент для кожної сторінки не слід включати у вихідні дані.
Якщо вказано без --без тексту прапор потім --з текстом мається на увазі.
DJVUXMLPARSER
Файли, створені компанією djvutoxml потім можна змінити за допомогою текстового редактора або XML
редактор. Програма djvuxmlparser аналізує файл XML inputxmfile щоб змінити
метадані відповідного файлу DjVu.
-o djvufile
В принципі цільовим файлом DjVu є файл, на який посилається файл ОБ'ЄКТ елемент
файл XML. Цей параметр надає засоби для заміни імені файлу, зазначеного в
ОБ'ЄКТ елемент.
DJVUXML ДОКУМЕНТ TYPE ВИЗНАЧЕННЯ
Файл визначення типу документа (DTD)
/usr/share/djvu/pubtext/DjVuXML-s.dtd
визначає вхід і вихід інструментів DjVu XML.
DTD DjVuXML-s є спрощенням HTML DTD:
http://www.w3c.org/TR/1998/REC-html40-19980424/sgml/dtd.html
з кількома новими атрибутами, доданими для DjVu. Кожна із зазначених сторінок DjVu
документ представлені як ОБ'ЄКТ елементи всередині BODY елемент файлу XML. Кожен
ОБ'ЄКТ елемент може містити декілька ПАРАМ елементи для визначення атрибутів, таких як назва сторінки,
роздільна здатність і гамма-фактор. Кожен ОБ'ЄКТ елемент також може містити один ПРИХОВАНИЙ ТЕКСТ
елемент для визначення прихованого тексту (зазвичай генерованого за допомогою механізму OCR) у DjVu
сторінка. Крім того, кожен ОБ'ЄКТ елемент може посилатися на одну область MAP елемент, який
містить кілька ПЛОЩА елементи для представлення всіх гіперпосилань і виділених областей всередині
документ DjVu.
ПАРАМ Елементи
легальний ПАРАМ елементи DjVu ОБ'ЄКТ включають, але не обмежуються ними СТР для уточнення
ім'я сторінки, GAMMA для визначення коефіцієнта гамма-поправки (зазвичай 2.2), і Точок на дюйм
для визначення роздільної здатності сторінки.
ПРИХОВАНИЙ ТЕКСТ Елементи
Команда ПРИХОВАНИЙ ТЕКСТ елементів складається з вкладених елементів COLUMNS PAGECOLUMNS, РЕГІОН, абзац,
ЛІНІЯ, та WORD. Найбільш глибоко вкладений елемент має вказувати обмеження
координати елемента в орієнтації зверху вниз. Тіло найбільш глибоко вкладене
елемент повинен містити текст. Більшість документів DjVu використовують обидва ЛІНІЯ or WORD в якості
елемент найнижчого рівня, але будь-який елемент є законним як елемент найнижчого рівня. Білий простір
завжди додається між WORD елементів, а між ними завжди додається переведення рядка ЛІНІЯ
елементів. Оскільки такі мови, як японська, не використовують пробіли між словами, це цілком
звичайний для азіатських механізмів OCR WORD замість символів.
MAP Елементи
Тіло MAP елементи складаються з ПЛОЩА елементів. Крім атрибутів
вказані в
http://www.w3.org/TR/1998/REC-html40-19980424/struct/objects.html#edef-ОБЛАСТЬ,
атрибути тип кордону, колір кордону, border та виділити були додані, щоб уточнити
тип рамки, колір межі, ширину межі та кольори виділення відповідно. Правові цінності
для кожного з цих атрибутів перераховані в DjVuXML-s DTD. Крім того, форма овальний
додано до законного списку фігур. В овалі використовується прямокутна обмежувальна рамка.
Використовуйте djvuxml онлайн за допомогою сервісів onworks.net