hocr2djvused - En ligne dans le Cloud

Il s'agit de la commande hocr2djvused qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

PROGRAMME:

Nom


hocr2djvused - hOCR à djvu convertisseur de script

SYNOPSIS


hocr2djvus [option...] [fichier-hocr...]

DESCRIPTION


hocr2djvused lit un ou plusieurs hOCR[1] fichiers (tels que produits par OCRopus[2] ou Cunéiforme[3] ou
Tesseract[4]) et les convertit en un djvu scripts.

À moins qu'un nom de fichier ne soit explicitement fourni sur la ligne de commande, hOCR est lu à partir du
entrée standard.

OPTIONS


Texte segmentation Options
-t lignes, --des détails lignes
Enregistrez l'emplacement de chaque ligne. N'enregistrez pas l'emplacement de mots particuliers ou
caractères.

-t gentils, --détails=mots
Enregistrez l'emplacement de chaque ligne et de chaque mot. N'enregistrez pas les emplacements de particulier
caractères.

C'est la valeur par défaut.

-t caractères, --détails=caractères
Enregistrez l'emplacement de chaque ligne, chaque mot et chaque caractère.

--word-segmentation=simple
Considérez chaque séquence non vide de caractères non blancs comme un seul mot.

C'est la valeur par défaut, bien qu'elle soit linguistiquement incorrecte.

--word-segmentation=uax29
Utilisez l'option Unicode Texte Segmentation[5] algorithme pour diviser les lignes en mots.

Cette option brise les hypothèses de certains outils DjVu selon lesquelles les mots sont séparés par des espaces,
et n'est donc pas recommandé.

Autres Options
--rotation=n
Supposons que les pages DjVu pivotent de n degrés.

--page-taille=largeurxla taille
Spécifie que la taille de la page est largeur pixels × la taille pixels.

Cette option est obligatoire pour les hOCR générées par l'écriture cunéiforme (< 0.8) et superflue
autrement.

--html5
Utiliser un HTML5 analyseur[6], qui est plus robuste mais plus lent que l'analyseur par défaut.

--fix-utf8
Essayez de résoudre les problèmes d'encodage UTF-8 et éliminez les caractères de contrôle indésirables.

Cette option peut être nécessaire pour hOCR généré par Cuneiform[7] ou Tesseract[8].

--version
Affiche les informations de version et quitte.

-h, --Aidez-moi
Affichez l'aide et quittez.

Utilisez hocr2djvused en ligne en utilisant les services onworks.net



Derniers programmes en ligne Linux et Windows