Este é o comando djvu2hocr que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online Windows ou emulador online MAC OS
PROGRAMA:
NOME
djvu2hocr - conversor de DjVu para hOCR
SINOPSE
djvu2hocr [opção...] arquivo djvu
djvu2hocr {--versão | --Socorro | -h}
DESCRIÇÃO
djvu2hocr converte texto oculto de um arquivo DjVu para o hOCRFormato [1].
OPÇÕES
Entrada doadores, opções
-p, --pages =intervalo de páginas
Especifica as páginas a serem ocultadas. intervalo de páginas é uma lista de subintervalos separados por vírgulas. Cada
subintervalo é uma única página (por exemplo, 17) ou um intervalo contíguo de páginas
(por exemplo, 37-42). As páginas são numeradas a partir de 1.
O padrão é converter todas as páginas.
Texto segmentação opções
--word-segmentation = simple
Use a mesma segmentação de palavras encontrada no arquivo DjVu.
Este é o padrão.
--word-segmentation = uax29
Use o Unicode Texto Segmentação[2] algoritmo para quebrar linhas em palavras, possivelmente
corrigindo a segmentação de palavras encontrada no arquivo DjVu.
HTML saída opções
--title =título
Especifica o título do documento.
O padrão é “camada de texto oculto DjVu”.
--css =estilo
Adicione o estilo CSS especificado ao documento.
Por exemplo, --css = '. ocrx_line { exibição: quadra; }' pode ser usado para preservar visualmente
quebras de linha.
Outros opções
--versão
Informações de versão de saída e saída.
-h, --Socorro
Exibir ajuda e sair.
PORTABILIDADE
djvu2hocr usa uma extensão personalizada para hOCR para reter caracteres que não podem ser diretamente
representado em um documento HTML / XML. Por exemplo, o caractere de controle BEL (^ G, U + 0007), é
convertido no seguinte fragmento HTML:
Use djvu2hocr online usando serviços onworks.net