Esta es la aplicación de Linux llamada pdfsandwich cuya última versión se puede descargar como pdfsandwich-0.1.7.tar.bz2. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.
Descargue y ejecute en línea esta aplicación llamada pdfsandwich con OnWorks de forma gratuita.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie el emulador en línea OnWorks Linux o Windows en línea o el emulador en línea MACOS desde este sitio web.
- 5. Desde el SO OnWorks Linux que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación, instálala y ejecútala.
pdfsándwich
DESCRIPCIÓN:
pdfsandwich genera archivos PDF de OCR "sándwich", es decir, los archivos PDF que contienen solo imágenes (pero no texto editable) serán procesados por reconocimiento óptico de caracteres (OCR) y el texto se agregará a cada página de manera invisible "detrás" de las imágenes.
pdfsandwich es una herramienta de línea de comandos que se supone que es útil para libros o revistas escaneados con OCR. Es capaz de reconocer el diseño de la página incluso para texto de varias columnas.
Esencialmente, pdfsandwich es un script contenedor que llama a los siguientes binarios: convert, unpaper, tesseract, gs y hocr2pdf (si tesseract <3.03). Se sabe que se ejecuta en sistemas Unix y se ha probado en Linux y MacOS X. Es compatible con el procesamiento paralelo en sistemas multiprocesador.
A diferencia de la mayoría de los programas de sándwich de la competencia, realiza el preprocesamiento de las imágenes escaneadas, como la eliminación de sesgos o la eliminación de bordes oscuros, etc.
Para más información, lea el manual: http://www.tobias-elze.de/pdfsandwich/index.html
Público
Usuarios finales / Escritorio
Interfaz de usuario
Línea de comando
Lenguaje de programación
OCaml (Objetivo Caml)
Categorías
Esta es una aplicación que también se puede obtener de https://sourceforge.net/projects/pdfsandwich/. Se ha alojado en OnWorks para poder ejecutarlo online de la forma más sencilla desde uno de nuestros Sistemas Operativos gratuitos.