این دستور djvu2hocr است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
djvu2hocr - مبدل DjVu به hOCR
خلاصه
djvu2hocr [انتخاب...] فایل djvu
djvu2hocr {- نسخه | --کمک | -h}
شرح
djvu2hocr متن مخفی را از یک فایل DjVu به فایل تبدیل می کند HOCRفرمت [1]
OPTIONS
ورودی انتخاب گزینه های
-p, --صفحات=محدوده ی صفحه
صفحات را به صورت مخفی مشخص می کند. محدوده ی صفحه فهرستی از زیرمجموعه های جدا شده با کاما است. هر یک
محدوده فرعی یا یک صفحه منفرد (مثلاً 17) یا یک محدوده به هم پیوسته از صفحات است
(مثلا 37-42). صفحات از 1 شماره گذاری می شوند.
پیش فرض تبدیل تمام صفحات است.
متن تقسیم بندی گزینه های
--word-segmentation=ساده
از همان تقسیم بندی کلماتی که در فایل DjVu یافت می شود استفاده کنید.
این پیش فرض است.
--word-segmentation=uax29
استفاده از یونیکد متن تقسیم بندی[2] الگوریتم برای شکستن خطوط به کلمات، احتمالا
رفع تقسیم بندی کلمات موجود در فایل DjVu.
HTML تولید گزینه های
--عنوان=عنوان
عنوان سند را مشخص می کند.
پیش فرض "لایه متن پنهان DjVu" است.
--css=سبک
استایل CSS مشخص شده را به سند اضافه کنید.
به عنوان مثال، --css='.ocrx_line { نمایش دادن: مسدود کردن؛ }' می توان برای حفظ بصری استفاده کرد
خط می شکند
دیگر گزینه های
- نسخه
اطلاعات نسخه خروجی و خروج.
-h, --کمک
نمایش راهنما و خروج.
قابلیت تحمل
djvu2hocr از یک پسوند سفارشی برای hOCR برای حفظ کاراکترهایی استفاده می کند که نمی توانند مستقیماً باشند
در یک سند HTML/XML نشان داده شده است. به عنوان مثال، کاراکتر کنترل BEL (^G، U+0007)، است
به قطعه HTML زیر تبدیل می شود:
با استفاده از خدمات onworks.net از djvu2hocr به صورت آنلاین استفاده کنید