Это приложение для Linux под названием Sanskrit / Hindi - Tesseract OCR, последний выпуск которого можно загрузить как tam.zip. Его можно запустить онлайн в бесплатном хостинг-провайдере OnWorks для рабочих станций.
Загрузите и запустите онлайн это приложение под названием Sanskrit / Hindi - Tesseract OCR with OnWorks бесплатно.
Следуйте этим инструкциям, чтобы запустить это приложение:
- 1. Загрузил это приложение на свой компьютер.
- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 3. Загрузите это приложение в такой файловый менеджер.
- 4. Запустите онлайн-эмулятор OnWorks Linux или Windows или онлайн-эмулятор MACOS с этого веб-сайта.
- 5. В только что запущенной ОС OnWorks Linux перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 6. Скачайте приложение, установите его и запустите.
Санскрит / хинди - Tesseract OCR
Ad
ОПИСАНИЕ
Читать https://sourceforge.net/projects/tesseracthindi/files/OCRHindi_using_VietOCR_and_Tesseract.pdf/download о том, как использовать vietocr gui для распознавания текста на хинди и санскрите с помощью tesseract-ocr*****
См. https://github.com/Shreeshrii/
Imagessan и imageshin для новых пар box / tiff, файлов обученных данных, статистики оценки ocr и файлов достоверных данных с изображениями для санскрита и хинди.
*****
Ниже приводится СТАРАЯ информация - сохраняется только для архивных целей.
Tesseract OCR 3.02 предоставляет hin.traineddata для распознавания текстов в сценариях деванагари. Однако учебные тексты, изображения и файлы в формате хинди не предоставляются, поэтому сложно повысить точность за счет дальнейшего улучшения обученных данных. Следует отметить, что распознавание будет более точным и быстрым, если обучение выполняется с тем же / аналогичным шрифтом, который используется в тексте, который нужно распознать.
Посмотреть https://sourceforge.net/p/tesseracthindi/wiki/OCR%20for%20Devanagari/ Больше подробностей.
Это приложение также можно загрузить с https://sourceforge.net/projects/tesseracthindi/. Он размещен в OnWorks, чтобы его можно было легко запускать в Интернете с помощью одной из наших бесплатных операционных систем.
