Це команда shapeclustering, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS.
ПРОГРАМА:
ІМ'Я
shapeclustering - навчання кластеризації форм для Tesseract
СИНТАКСИС
формогрупування -D вихідний_директор -U unicharset -O mfunicharset -F font_props -X xheights
Фото...
ОПИС
кластеризація форм(1) приймає витягнуті файли .tr функцій (згенеровані за допомогою tesseract(1) запустити в а
спеціальний режим із коробкових файлів) і створює файл формувальна таблиця і розширений унічарсет.
Ця програма все ще є експериментальною і не потрібна (поки що) для навчання Tesseract.
ВАРІАНТИ
-U Фото
Unicharset, створений за допомогою unicharset_extractor(1).
-D реж
Каталог для запису вихідних файлів.
-F файл_властивостей шрифту
(Вхідний) файл властивостей шрифту, де кожен рядок має такий вигляд, де кожен
поле, відмінне від назви шрифту, має значення 0 або 1:
'font_name' 'italic' 'bold' 'fixed_pitch' 'serif' 'fraktur'
-X xheights_file
(Вхідний) файл x висоти, кожен рядок має такий вигляд, де xheight
розраховується як піксель x висота символу, намальованого з розміром 32 pt на 300 dpi. [ Тобто,
якщо основа х висота + висхідні + низхідні = 133, скільки дорівнює х висота? ]
'font_name' 'xheight'
-O Фото
Вихідний набір символів, який буде надано комбінувати_tessdata(1).
Використовуйте shapeclustering онлайн за допомогою служб onworks.net