Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen djvu2hocr komutudur.
Program:
ADI
djvu2hocr - DjVu'dan hOCR'ye dönüştürücü
SİNOPSİS
djvu2hocr [seçenek...] djvu dosyası
djvu2hocr {--versiyon | --yardım et | -h}
TANIM
djvu2hocr, gizli metni bir DjVu dosyasından hOCR[1] biçimi.
SEÇENEKLER
Giriş seçim seçenekleri
-p, --sayfalar=sayfa aralığı
Gizlenecek sayfaları belirtir. sayfa aralığı alt aralıkların virgülle ayrılmış bir listesidir. Her biri
alt aralık ya tek bir sayfadır (örn. 17) ya da bitişik bir sayfa aralığıdır
(örn. 37-42). Sayfalar 1'den numaralandırılmıştır.
Varsayılan, tüm sayfaları dönüştürmektir.
Metin bölünme seçenekleri
--word-segmentasyon=basit
DjVu dosyasında bulunanla aynı kelime segmentasyonunu kullanın.
Bu varsayılan.
--word-segmentasyon=uax29
Kullan Unicode Metin Bölünme[2] satırları kelimelere ayırma algoritması, muhtemelen
DjVu dosyasında bulunan kelime segmentasyonunu düzeltme.
HTML çıktı seçenekleri
--başlık=başlık
Belge başlığını belirtir.
Varsayılan "DjVu gizli metin katmanı"dır.
--css=stil
Belirtilen CSS stilini belgeye ekleyin.
Örneğin, --css='.ocrx_line { ekran: blok; }' görsel olarak korumak için kullanılabilir
satır araları.
Diğer seçenekleri
--versiyon
Sürüm bilgisi çıktısı alın ve çıkın.
-h, --yardım et
Yardımı göster ve çık.
TAŞINABİLİRLİK
djvu2hocr, doğrudan kullanılamayan karakterleri korumak için hOCR'ye özel bir uzantı kullanır
bir HTML/XML belgesinde temsil edilir. Örneğin, kontrol karakteri BEL (^G, U+0007),
aşağıdaki HTML öbeğine dönüştürülür:
onworks.net hizmetlerini kullanarak djvu2hocr'ı çevrimiçi kullanın