unicharset_extractor - عبر الإنترنت في السحابة

هذا هو الأمر unicharset_extractor الذي يمكن تشغيله في موفر الاستضافة المجاني OnWorks باستخدام إحدى محطات العمل المجانية المتعددة عبر الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت

برنامج:

اسم


unicharset_extractor - استخراج unicharset من ملفات Tesseract boxfiles

موجز


أحادي_المستخرج [-د دير] FILE

الوصف


يحتاج Tesseract إلى معرفة مجموعة الأحرف المحتملة التي يمكنه إخراجها. لتوليد
ملف بيانات unicharset، استخدم برنامج unicharset_extractor على نفس صفحات التدريب
ملفات المربع المحيط المستخدمة للتجميع:

unicharset_extractor Fontfile_1.box Fontfile_2.box ...

سيتم وضع Unicharset في الملف دير/unicharset، أو ببساطة ./unicharset إذا لا
يتم توفير دليل الإخراج.

يحتاج Tesseract أيضًا إلى الوصول إلى خصائص الأحرف isalpha، وisdigit، وisupper،
أقل، علامات الترقيم. كل هذه البيانات المساعدة وأكثر يتم ترميزها في هذا الملف. (يرى
أحادي(5))

إذا كان نظامك يدعم وظائف wctype، فسيتم تعيين هذه القيم تلقائيًا بواسطة
unicharset_extractor وليس هناك حاجة لتحرير ملف unicharset. على بعض كبار السن
الأنظمة (مثل Windows 95)، يجب تحرير ملف unicharset يدويًا لإضافة هذه الخاصية
رموز الوصف.

نوت يجب إعادة إنشاء ملف unicharset عندما يكون هناك inttem وnormproto وpffmtable
تم إنشاؤها (أي يجب إعادة إنشائها جميعًا عند تغيير ملف الصندوق) حسب الحاجة
تكون متزامنة. أصبح هذا أسهل مما كان عليه في الإصدارات السابقة عن طريق تشغيل unicharset_extractor
قبل mftraining وcntraining، وإعطاء unicharset إلى mftraining.

استخدم unicharset_extractor عبر الإنترنت باستخدام خدمات onworks.net



أحدث برامج Linux و Windows عبر الإنترنت