To jest polecenie djvu2hocr, które można uruchomić w bezpłatnym dostawcy hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS
PROGRAM:
IMIĘ
djvu2hocr - konwerter DjVu na hOCR
STRESZCZENIE
djvu2hocr [opcja...] plik djvu
djvu2hocr {--wersja | --help | -h}
OPIS
djvu2hocr konwertuje ukryty tekst z pliku DjVu do formatu HOCR[1] formacie.
OPCJE
Wkład wybór Opcje
-p, --strony=zakres stron
Określa strony do ukrycia. zakres stron jest rozdzieloną przecinkami listą podzakresów. Każdy
podzakres to albo pojedyncza strona (np. 17), albo ciągły zakres stron
(np. 37-42). Strony są numerowane od 1.
Domyślnie konwertowane są wszystkie strony.
Tekst segmentacja Opcje
--segmentacja słów=prosta
Użyj tej samej segmentacji słów, jaką można znaleźć w pliku DjVu.
To jest ustawienie domyślne.
--segmentacja słów=uax29
Użyj Unicode Tekst Segmentacja[2] algorytm prawdopodobnie dzielący linie na słowa
naprawianie segmentacji słów znalezionej w pliku DjVu.
HTML wydajność Opcje
--tytuł=tytuł
Określa tytuł dokumentu.
Wartość domyślna to „Ukryta warstwa tekstowa DjVu”.
--css=styl
Dodaj określony styl CSS do dokumentu.
Na przykład, --css='.ocrx_line { pokaz: blok; }' można wykorzystać do wizualnej konserwacji
podziały wierszy.
Inne Opcje
--wersja
Wypisz informacje o wersji i zakończ.
-h, --help
Wyświetl pomoc i wyjdź.
RUCHLIWOŚĆ
djvu2hocr używa niestandardowego rozszerzenia hOCR, aby zachować znaki, których nie można umieścić bezpośrednio
reprezentowane w dokumencie HTML/XML. Na przykład znak kontrolny BEL (^G, U+0007) to
przekonwertowany na następujący fragment HTML:
Korzystaj z djvu2hocr online, korzystając z usług onworks.net