זוהי הפקודה hocr2djvused שניתן להריץ בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו בחינם כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS
תָכְנִית:
שֵׁם
hocr2djvused - hOCR to djvused ממיר סקריפטים
תַקצִיר
hocr2djvused [אוֹפְּצִיָה...] [קובץ hocr...]
תיאור
hocr2djvused קורא אחד או יותר hOCR[1] קבצים (כפי שהופק על ידי OCRopus[2] או כְּתַב היתֵדוֹת[3] או
טסרקט[4]) וממיר אותם בא djvused תַסרִיט.
אלא אם כן שם קובץ מסופק במפורש בשורת הפקודה, hOCR נקרא מה-
קלט סטנדרטי.
אפשרויות
טקסט פילוח אפשרויות
-t קווים, --פרטים קווים
רשום מיקום של כל שורה. אל תרשום מיקומים של מילים מסוימות או
תווים.
-t מילים, --פרטים=מילים
רשום מיקום של כל שורה וכל מילה. אל תרשום מיקומים מסוימים
תווים.
זוהי ברירת המחדל.
-t טנקים, --פרטים=תווים
הקלט את המיקום של כל שורה, כל מילה וכל תו.
--מילה-פילוח=פשוט
ראה כל רצף לא ריק של תווים שאינם רווח לבן כמילה אחת.
זוהי ברירת המחדל, למרות היותה לא נכונה מבחינה לשונית.
---word-segmentation=uax29
השתמש Unicode טקסט פילוח[5] אלגוריתם לפירוק שורות למילים.
אפשרות זו שוברת את ההנחות של כמה כלי DjVu לפיהם מילים מופרדות על ידי רווחים,
ולכן זה לא מומלץ.
אחר אפשרויות
--רוטציה=n
נניח שדפי DjVu מסובבים על ידי n מעלות.
--עמוד-גודל=רוחבxגובה
מציין שגודל העמוד הוא רוחב פיקסלים × גובה פיקסלים.
אפשרות זו נדרשת עבור hOCR שנוצר על ידי כתובית יתדות (<0.8) ומיותר
אחרת.
--html5
להשתמש HTML5 מנתח[6], שהוא חזק יותר אך איטי יותר מפרסר ברירת המחדל.
--fix-utf8
נסה לתקן בעיות קידוד UTF-8 ולחסל תווי בקרה לא רצויים.
אפשרות זו עשויה להיות נחוצה עבור hOCR שנוצר על ידי Cuneiform[7] או Tesseract[8].
--גִרְסָה
פלט מידע על גרסת ויציאה.
-h, - עזרה
הצג עזרה וצא.
השתמש ב-hocr2djvused באינטרנט באמצעות שירותי onworks.net