انجليزيالفرنسيةالإسبانية

Ad


OnWorks فافيكون

Combined_tessdata - عبر الإنترنت في السحابة

قم بتشغيل comb_tessdata في موفر استضافة OnWorks المجاني عبر Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت

هذا هو الأمر combin_tessdata الذي يمكن تشغيله في مزود الاستضافة المجانية OnWorks باستخدام إحدى محطات العمل المجانية المتعددة عبر الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت

برنامج:

اسم


Combined_tessdata - دمج / استخراج / الكتابة فوق بيانات Tesseract

موجز


الجمع بين البيانات [OPTION] FILE

الوصف


الجمع بين البيانات(1) هو البرنامج الرئيسي لدمج / استخراج / الكتابة فوق مكونات tessdata
في ملفات [lang] .traineddata.

لدمج جميع مكونات tessdata الفردية (unicharset ، DAWGs ، المصنف
القوالب ، الغموض ، تكوينات اللغة) الموجودة في ، على سبيل المثال ، /الصفحة الرئيسية/USER USER / temp / eng. * تشغيل:

الجمع بين البيانات /الصفحة الرئيسية/$ USER / temp / eng.

ستكون النتيجة ملف tessdata مدمج /الصفحة الرئيسية/USER USER / temp / eng.traineddata

حدد الخيار -e إذا كنت ترغب في استخراج مكونات فردية من ملف
ملف بيانات التدريب. على سبيل المثال ، لاستخراج ملف تكوين اللغة و unicharset من
تشغيل tessdata / eng.traineddata:

Combined_tessdata -e tessdata / eng.traineddata \
/الصفحة الرئيسية/$ USER / temp / eng.config /الصفحة الرئيسية/USER USER / temp / eng.unicharset

ستتم كتابة ملف التكوين المطلوب و unicharset /الصفحة الرئيسية/$ USER / temp / eng.config
/الصفحة الرئيسية/USER USER / temp / eng.unicharset

حدد الخيار -o للكتابة فوق المكونات الفردية لملف [lang] .traineddata المحدد.
على سبيل المثال ، لاستبدال تكوين اللغة و unichar ملفات غامضة في ملفات
استخدام tessdata / eng.traineddata:

Combined_tessdata -o tessdata / eng.traineddata \
/الصفحة الرئيسية/$ USER / temp / eng.config /الصفحة الرئيسية/USER / temp / eng.unicharambigs. دولار أمريكي

نتيجة لذلك ، ستحتوي tessdata / eng.traineddata على تهيئة اللغة الجديدة و unichar
ambigs ، بالإضافة إلى جميع DAWGs الأصلية وقوالب المصنفات وما إلى ذلك.

ملاحظة: يجب أن تحتوي أسماء الملفات المراد الاستخراج منها والكتابة فوقها بامتداد
لواحق الملفات المناسبة (الامتدادات) التي تشير إلى نوع مكون tessdata الخاص بهم
(.unicharset ل unicharset ، .unicharambigs ل unichar ambigs ، إلخ). انظر k * FileSuffix
متغير في ccutil / tessdatamanager.h.

حدد الخيار -u لفك ضغط جميع المكونات إلى المسار المحدد:

Combined_tessdata -u tessdata / eng.traineddata /الصفحة الرئيسية/$ USER / temp / eng.

هذا سيخلق /الصفحة الرئيسية/ملفات USER / temp / eng. * بمكونات tessdata فردية من
tessdata / eng.traineddata.

OPTIONS


-e .البيانات المدربة FILE...: لاستخراج المكونات المحددة من ملف .traineddata

-o .البيانات المدربة FILE...: الكتابة فوق المكونات المحددة لملف .traineddata بامتداد
تلك المقدمة على خط كوماند.

-u .البيانات المدربة باثبريفيكس يفك حزم .traineddata باستخدام البادئة المتوفرة.

تحفظات


بادئة يشير إلى بادئة الملف الكامل ، بما في ذلك النقطة (.)

مكونات


المكونات في ملف Tesseract lang.traineddata اعتبارًا من Tesseract 3.02 مختصرة
هو موضح أدناه؛ لمزيد من المعلومات حول العديد من هذه الملفات ، راجع
https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract

lang.config
(اختياري) تتخطى اللغة الخاصة بمتغيرات التكوين الافتراضية.

لانج
(مطلوب) قائمة الرموز التي يتعرف عليها موقع Tesseract مع الخصائص. يرى
أحادي(5).

lang.unicharambigs
(اختياري) يحتوي هذا الملف على معلومات عن أزواج من الرموز التي تم التعرف عليها
كثيرا ما مرتبك. على سبيل المثال، rn و m.

lang.inttemp
(مطلوب) قوالب أشكال الأحرف لكل unichar. من إنتاج com.mftraining(1).

lang.pffmtable
(مطلوب) عدد الميزات المتوقعة لكل unichar. من إنتاج com.mftraining(1)
تبدأ من .tr الملفات.

lang.normproto
(مطلوب) النماذج الأولية لتطبيع الأحرف التي تم إنشاؤها بواسطة com.cntraining(1) من .tr
الملفات.

lang.punc-dawg
(اختياري) dawg مصنوع من أنماط الترقيم الموجودة حول الكلمات. جزء "الكلمة"
بمسافة واحدة.

lang.word-dawg
(اختياري) dawg مصنوع من كلمات القاموس من اللغة.

لانج رقم دوج
(اختياري) dawg مصنوع من الرموز التي تحتوي في الأصل على أرقام. كل رقم هو
استبداله بحرف مسافة.

لانج فريك دوج
(اختياري) dawg مصنوع من أكثر الكلمات شيوعًا التي كان من الممكن أن تدخل فيها
كلمة دوج.

lang. الطول الثابت dawgs
(اختياري) عدة فواتير بأطوال ثابتة مختلفة - مفيدة للغات مثل
صينى.

lang.cube-unicharset
(اختياري) مجموعة أحادية للمكعب ، إذا تم تدريب المكعب على مجموعة مختلفة من الرموز.

lang.cube-word-dawg
(اختياري) كلمة dawg للمكعب أحادي الشكل البديل. لا حاجة إذا تم تدريب Cube
مع Tesseract's unicharset.

لانج
(اختياري) عندما تكون موجودة ، فإن الشكل القابل للتشكيل هو طبقة إضافية بين الشخصية
المصنف ومعرف الكلمات الذي يسمح لمصنف الأحرف بإرجاع ملف
مجموعة من معرفات وخطوط unichar بدلاً من معرف وحيد وخط واحد.

لانج بيجرام دوج
(اختياري) dawg من الكلمات الكبيرة حيث يتم فصل الكلمات بمسافة وكل منها
يتم استبدال الرقم بـ ?.

لانج أونامبيج دوج
(اختياري) TODO: وصف.

lang.params- نموذج التدريب
(اختياري) TODO: وصف.

التاريخ


الجمع بين البيانات(1) ظهر لأول مرة في الإصدار 3.00 من Tesseract

استخدم comb_tessdata عبر الإنترنت باستخدام خدمات onworks.net


خوادم ومحطات عمل مجانية

قم بتنزيل تطبيقات Windows و Linux

  • 1
    JXplorer - متصفح Java Ldap
    JXplorer - متصفح Java Ldap
    برنامج جافا LDAP مع دعم LDIF ،
    الأمان (بما في ذلك SSL و SASL و GSSAPI) ،
    مترجم إلى العديد من اللغات (inc.
    الصينية) والمساعدة عبر الإنترنت ونماذج المستخدم و
    كثير غير ذلك ...
    تنزيل JXplorer - متصفح Java Ldap
  • 2
    PosteRazor - اصنع الملصق الخاص بك!
    PosteRazor - اصنع الملصق الخاص بك!
    تريد طباعة ملصق؟ تخفيضات PosteRazor
    ملف صورة إلى أجزاء ويمكنك ذلك
    ثم اطبعها على الطابعة وألصقها
    معًا على ملصق. من السهل FLTK على أساس
    استعمال...
    تنزيل PosteRazor - اصنع الملصق الخاص بك!
  • 3
    فيزر
    فيزر
    Phaser هو مفتوح سريع ومجاني وممتع
    مصدر إطار عمل لعبة HTML5 الذي يوفر
    عرض WebGL و Canvas عبر
    متصفحات الويب لسطح المكتب والجوال. ألعاب
    يمكن المشاركة ...
    تحميل Phaser
  • 4
    محرك VASSAL
    محرك VASSAL
    VASSAL هو محرك لعبة للإبداع
    النسخ الإلكترونية للسبورة التقليدية
    وألعاب الورق. يوفر الدعم ل
    عرض قطعة اللعبة والتفاعل ،
    و...
    قم بتنزيل محرك VASSAL
  • 5
    OpenPDF - شوكة iText
    OpenPDF - شوكة iText
    OpenPDF هي مكتبة جافا للإنشاء
    وتحرير ملفات PDF باستخدام LGPL و
    ترخيص MPL مفتوح المصدر. OpenPDF هو ملف
    LGPL / MPL وريث مفتوح المصدر لـ iText ،
    ا...
    قم بتنزيل OpenPDF - Fork of iText
  • 6
    ساجا جيس
    ساجا جيس
    SAGA - النظام الآلي
    التحليلات الجيولوجية - هو جغرافي
    برنامج نظام المعلومات (GIS) مع
    قدرات هائلة للبيانات الجغرافية
    المعالجة وآنا ...
    تنزيل SAGA GIS
  • أكثر "

أوامر لينكس

  • 1
    aarch64-linux-gnu-gnatbind
    aarch64-linux-gnu-gnatbind
    جنات ، جنات بيند ، جناتبل ، جناتشوب ،
    gnatfind ، gnathtml ، gnatkr ، gnatlink ،
    gnatls ، gnatmake ، gnatprep ، gnatpsta ،
    gnatpsys ، gnatxref - مربع أدوات GNAT
    الوصف: ال ...
    قم بتشغيل aarch64-linux-gnu-gnatbind
  • 2
    aarch64-linux-gnu-gnatchop-5
    aarch64-linux-gnu-gnatchop-5
    جنات ، جنات بيند ، جناتبل ، جناتشوب ،
    gnatfind ، gnathtml ، gnatkr ، gnatlink ،
    gnatls ، gnatmake ، gnatprep ، gnatpsta ،
    gnatpsys ، gnatxref - مربع أدوات GNAT
    الوصف: ال ...
    قم بتشغيل aarch64-linux-gnu-gnatchop-5
  • 3
    معلومات cpupower الخمول
    معلومات cpupower الخمول
    معلومات الخمول cpupower - فائدة ل
    استرداد معلومات kernel الخمول لوحدة المعالجة المركزية
    SYNTAX: cpupower [-c cpulist]
    معلومات الخمول [خيارات] الوصف: أداة
    الذي يطبع ص ...
    قم بتشغيل cpupower-idle-info
  • 4
    مجموعة cpupower الخمول
    مجموعة cpupower الخمول
    مجموعة الخمول cpupower - الأداة المساعدة لضبط وحدة المعالجة المركزية
    خيارات kernel الخاصة بحالة الخمول
    SYNTAX: cpupower [-c cpulist]
    معلومات الخمول [خيارات] الوصف: ملف
    cpupower الخمول حد ذاته ...
    قم بتشغيل cpupower-idle-set
  • 5
    ز
    ز
    g.mapsets - تعديل / طباعة المستخدم
    مسار البحث الحالي mapset. يؤثر على
    وصول المستخدم إلى البيانات الموجودة ضمن
    خرائط أخرى في الموقع الحالي. ...
    قم بتشغيل g.mapsetsgrass
  • 6
    ز مساج جراس
    ز مساج جراس
    g.message - يطبع رسالة ، تحذير ،
    معلومات التقدم ، أو خطأ فادح في
    طريقة العشب. يجب استخدام هذه الوحدة في
    البرامج النصية للرسائل المقدمة للمستخدم.
    KEYWO ...
    تشغيل g.messagegrass
  • أكثر "

Ad