Ito ang command shapeclustering na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
shapeclustering - shape clustering training para sa Tesseract
SINOPSIS
shapeclustering -D output_dir -U unicharset -O mfunicharset -F font_props -X xheights
FILE...
DESCRIPTION
shapeclustering(1) kumukuha ng mga na-extract na feature na .tr file (binuo ni tesseract(1) tumakbo sa a
espesyal na mode mula sa mga box file) at gumagawa ng isang file mahubog at isang pinahusay na unicharset.
Ang program na ito ay eksperimental pa rin, at hindi kinakailangan (pa) para sa pagsasanay sa Tesseract.
Opsyon
-U FILE
Ang unicharset na nabuo ni unicharset_extractorNa (1).
-D dir
Direktoryo kung saan isusulat ang mga output file.
-F font_properties_file
(Input) font properties file, kung saan ang bawat linya ay nasa sumusunod na anyo, kung saan ang bawat isa
field maliban sa pangalan ng font ay 0 o 1:
'font_name' 'italic' 'bold' 'fixed_pitch' 'serif' 'fraktur'
-X xheights_file
(Input) x heights file, ang bawat linya ay nasa sumusunod na anyo, kung saan ang xheight ay
kinakalkula bilang pixel x taas ng isang character na iginuhit sa 32pt sa 300 dpi. [ Yan ay,
kung base x taas + ascenders + descenders = 133, magkano ang x taas? ]
'font_name' 'xheight'
-O FILE
Ang output unicharset na ibibigay sa combine_tessdataNa (1).
Gumamit ng shapeclustering online gamit ang mga serbisyo ng onworks.net