אנגליתצרפתיתספרדי

Ad


סמל OnWorks

mmseg - מקוון בענן

הפעל mmseg בספק אירוח בחינם של OnWorks על אובונטו מקוון, פדורה מקוון, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

זוהי הפקודה mmseg שניתן להפעיל בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

תָכְנִית:

שֵׁם


mmseg - מקטע תואם מקסימלי טקסט סיני.

תַקצִיר


mmseg -d dict_file [אוֹפְּצִיָה]... [corpus_file] ...

תיאור


mmseg הוא כלי לפילוח טקסט סיני למילים באמצעות אלגוריתם התאמה מקסימלית.
mmseg מגזרים corpus_file, או קלט רגיל אם לא צוין שם קובץ, וכתוב את ה
תוצאה מפולחת לפלט סטנדרטי.

אפשרויות


-d dict_file
השתמש dict_file בתור לקסיקון. ניתן למצוא לקסיקון ברירת מחדל ב
/usr/share/sunpinyin-slm/dict.utf8.

-f,--פוּרמָט (טֶקסט|בן)
פורמט פלט, יכול להיות 'טקסט' או 'פח'. ברירת המחדל 'bin'. בדרך כלל, במצב טקסט, word
טקסט מופק, בעוד שבמצב בינארי, מספר שלם קצר בינארי של מילות המילים
נכתב ל-stdout.

-s, --סטוק STOK_ID
מזהה אסימון משפט. ברירת מחדל 10. זה ייכתב לפלט במצב בינארי לאחר
כל משפט.

-i, --show-id
הצג מידע מזהה. במצב פורמט פלט טקסט, צרף מזהה אחרי מילים ידועות. אם מתחת
מצב בינארי, הדפס מזהים בטקסט.

-a, --מזהה דו-משמעי AMBI-ID
אמצעים מעורפלים א ב ג => A BC or AB C. אם צוין (AMBI-ID != 0), הרצף א ב ג
לא יפולח, במצב בינארי, את AMBI-ID נכתב החוצה; במצב טקסט,
" א ב ג " יופיע. ברירת המחדל היא 0.

אורים


תַחַת בינרי במצב, מזהה רציף של 0 מתמזגים ל-0 אחד. מתחת טֶקסט מצב, אין מקום
מוכנסים בין מילים לא ידועות.

השתמש ב-mmseg באינטרנט באמצעות שירותי onworks.net


שרתים ותחנות עבודה בחינם

הורד אפליקציות Windows & Linux

פקודות לינוקס

Ad