عربيالفرنسيةالإسبانية

Ad


OnWorks فافيكون

mmseg - عبر الإنترنت في السحابة

قم بتشغيل mmseg في موفر الاستضافة المجاني OnWorks عبر Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت

هذا هو الأمر mmseg الذي يمكن تشغيله في موفر الاستضافة المجاني OnWorks باستخدام إحدى محطات العمل المجانية المتعددة عبر الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت

برنامج:

اسم


mmseg - الحد الأقصى لمطابقة النص الصيني.

موجز


mmseg -d dict_file [خيار] ... [corpus_file] ...

الوصف


mmseg هي أداة لتقسيم النص الصيني إلى كلمات باستخدام خوارزمية المطابقة القصوى.
mmseg شرائح corpus_file، أو الإدخال القياسي إذا لم يتم تحديد اسم ملف ، واكتب
نتيجة مجزأة إلى الناتج القياسي.

OPTIONS


-d dict_file
استعمل dict_file كمعجم. يمكن العثور على المعجم الافتراضي على
/usr/share/sunpinyin-slm/dict.utf8.

-f,--صيغة (نص|بن)
تنسيق الإخراج ، يمكن أن يكون "نص" أو "حاوية". الافتراضي "بن". عادة ، في وضع النص ، كلمة
يتم إخراج النص ، بينما في الوضع الثنائي ، يكون عدد صحيح ثنائي قصير من معرفات الكلمات
مكتوبة ل stdout.

-s, - ستوك STOK_ID
معرّف الرمز المميز للجملة. 10. ستتم كتابته للإخراج في الوضع الثنائي بعد ذلك
كل جملة.

-i, - إظهار معرف
إظهار معلومات الهوية. ضمن وضع تنسيق إخراج النص ، أرفق معرف بعد الكلمات المعروفة. إذا تحت
الوضع الثنائي ، طباعة المعرف (المعرفات) في النص.

-a, --معرف غامض معرف AMBI
وسائل غامضة ايه بي سي => A BC or AB C. إذا تم تحديد (معرف AMBI != 0)، التسلسل ايه بي سي
لن يتم تجزئة الملف في الوضع الثنائي معرف AMBI مكتوب؛ في وضع النص،
" اي بي سي " سيتم إخراجه. الافتراضي هو 0.

الملاحظات


تحت ثنائي الوضع ، يتم دمج معرّف 0 المتتالي في 0 واحد. تحت نص الوضع ، لا توجد مساحة
بين الكلمات غير المعروفة.

استخدم mmseg عبر الإنترنت باستخدام خدمات onworks.net


خوادم ومحطات عمل مجانية

قم بتنزيل تطبيقات Windows و Linux

أوامر لينكس

Ad