Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen djvuxml komutudur.
Program:
ADI
djvutoxml, djvuxmlparser - DjVuLibre XML Araçları.
SİNOPSİS
djvutoxml [seçenekleri] inputdjvu dosyası [çıktıxml dosyası]
djvuxml ayrıştırıcı [ -o djvu dosyası ] girdixml dosyası
AÇIKLAMA
DjVuLibre XML Araçları, meta verileri, köprüleri ve gizli metni düzenlemeyi sağlar
DjVu dosyalarıyla ilişkili. farklı djvused(1) DjVuLibre XML Araçları, XML'e dayanır
teknolojisi ve XML düzenleyicilerinden ve doğrulayıcılarından yararlanabilir.
DJVUTOXML
Programı djvutoxml bir XML dosyası oluşturur çıktıxml dosyası orijinaline bir referans içeren
DjVu belgesi inputdjvu dosyası yanı sıra meta verileri, köprüleri ve
DjVu dosyasıyla ilişkili gizli metin.
Aşağıdaki seçenekler desteklenir:
--sayfa sayfa numarası
Çok sayfalı bir belgede bir sayfa seçin. Bu seçenek olmadan, djvutoxml çıktılar
Belgenin tüm sayfalarına karşılık gelen XML.
--ile-metin
belirtir GİZLİ METİN her sayfa için eleman çıktıya dahil edilmelidir.
olmadan belirtilirse --ile-anno bayrak o zaman --olmadan-anno ima edilir. Eğer
hiçbiri --metinle, --metinsiz, --anno ile, or --olmadan-anno, bayraklar
belirtilen, ardından --ile-metin ve --ile-anno bayraklar kastedilmektedir.
--metinsiz-metinsiz
çıktısının alınmayacağını belirtir. GİZLİ METİN her sayfa için eleman. olmadan belirtilirse
the --olmadan-anno bayrak o zaman --ile-anno bayrak kastedilmektedir.
--ile-anno
Alanı belirtir MAP her sayfa için eleman çıktıya dahil edilmelidir. Eğer
olmadan belirtilen --ile-metin bayrak o zaman --metinsiz-metinsiz bayrak kastedilmektedir.
--olmadan-anno
Alanı belirtir MAP her sayfa için eleman çıktıya dahil edilmemelidir.
olmadan belirtilirse --metinsiz-metinsiz bayrak o zaman --ile-metin bayrak kastedilmektedir.
DJVUXMLPARSER
Tarafından üretilen dosyalar djvutoxml daha sonra bir metin düzenleyici veya bir XML kullanılarak değiştirilebilir
editör. programı djvuxml ayrıştırıcı XML dosyasını ayrıştırır girdixml dosyası değiştirmek için
karşılık gelen DjVu dosyasının meta verileri.
-o djvu dosyası
Prensipte, hedef DjVu dosyası, tarafından başvurulan dosyadır. NESNE unsuru
XML dosyası. Bu seçenek, içinde belirtilen dosya adını geçersiz kılmanın yollarını sağlar.
the NESNE eleman.
DJVUXML BELGE TİP TANIM
Belge türü tanım dosyası (DTD)
/usr/share/djvu/pubtext/DjVuXML-s.dtd
DjVu XML araçlarının giriş ve çıkışını tanımlar.
DjVuXML-s DTD, HTML DTD'nin basitleştirilmiş halidir:
http://www.w3c.org/TR/1998/REC-html40-19980424/sgml/dtd.html
DjVu'ya özgü birkaç yeni özellik eklendi. Bir DjVu'nun belirtilen sayfalarının her biri
belge olarak temsil edilir NESNE içindeki öğeler Estetik XML dosyasının öğesi. Her biri
NESNE eleman birden fazla içerebilir PARAM sayfa adı gibi nitelikleri belirtmek için öğeler,
çözünürlük ve gama faktörü. Her biri NESNE eleman ayrıca bir tane içerebilir GİZLİMETİN
DjVu içindeki gizli metni (genellikle bir OCR motoruyla oluşturulur) belirtmek için öğe
sayfa. ek olarak her biri NESNE eleman tek bir alana başvurabilir MAP hangi eleman
birden fazla içerir ALAN içindeki tüm köprüyü temsil edecek ve alanları vurgulayacak öğeler
DjVu belgesi.
PARAM Elements
Yasal Şartlar PARAM bir DjVu'nun unsurları NESNE içerir ancak bunlarla sınırlı değildir SAYFA belirtmek için
sayfa adı, GAMMA gama düzeltme faktörünü (normalde 2.2) belirlemek için ve DPI
Sayfa çözünürlüğünü belirtmek için.
GİZLİ METİN Elements
The GİZLİ METİN elemanlar iç içe geçmiş elemanlardan oluşur SAYFASÜTUNLAR, BÖLGE, PARAGRAF,
HAT, ve WORD. Belirtilen en derin iç içe öğe, sınırlamayı belirtmelidir
elemanın yukarıdan aşağıya yönelimdeki koordinatları. En derinden iç içe olanın gövdesi
öğe metni içermelidir. Çoğu DjVu belgesi her ikisini de kullanır LINE or WORD gibi
en düşük seviye eleman, ancak herhangi bir eleman en düşük seviye eleman olarak yasaldır. beyaz bir boşluk
her zaman arasına eklenir WORD öğeleri ve bir satır beslemesi her zaman arasına eklenir LINE
elementler. Japonca gibi diller kelimeler arasında boşluk kullanmadığı için
Asya OCR motorlarının kullanması için ortak WORD yerine karakter olarak.
MAP Elements
Vücudun MAP elemanlar oluşur ALAN elementler. Niteliklere ek olarak
içinde listelenen
http://www.w3.org/TR/1998/REC-html40-19980424/struct/objects.html#edef-ALAN,
nitelikler sınır türü, sınır rengi, sınır, ve vurgulamak belirtmek için eklendi
sırasıyla kenarlık türü, kenarlık rengi, kenarlık genişliği ve vurgu renkleri. Yasal değerler
bu özniteliklerin her biri için DjVuXML-s DTD'de listelenmiştir. Ek olarak, şekil oval
yasal şekiller listesine eklendi. Bir oval, dikdörtgen bir sınırlayıcı kutu kullanır.
onworks.net hizmetlerini kullanarak djvuxml'i çevrimiçi kullanın