mmseg - ക്ലൗഡിൽ ഓൺലൈനിൽ

ഉബുണ്ടു ഓൺലൈൻ, ഫെഡോറ ഓൺലൈൻ, വിൻഡോസ് ഓൺലൈൻ എമുലേറ്റർ അല്ലെങ്കിൽ MAC OS ഓൺലൈൻ എമുലേറ്റർ എന്നിങ്ങനെയുള്ള ഞങ്ങളുടെ ഒന്നിലധികം സൗജന്യ ഓൺലൈൻ വർക്ക്സ്റ്റേഷനുകളിലൊന്ന് ഉപയോഗിച്ച് OnWorks സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവിൽ പ്രവർത്തിപ്പിക്കാവുന്ന mmseg കമാൻഡ് ആണിത്.

പട്ടിക:

NAME


mmseg - പരമാവധി പൊരുത്തപ്പെടുന്ന സെഗ്മെന്റ് ചൈനീസ് ടെക്സ്റ്റ്.

സിനോപ്സിസ്


mmseg -d DIC_File [ഓപ്ഷൻ]... [corpus_file]...

വിവരണം


mmseg പരമാവധി പൊരുത്തപ്പെടുന്ന അൽഗോരിതം ഉപയോഗിച്ച് ചൈനീസ് ടെക്‌സ്‌റ്റ് പദങ്ങളായി വിഭജിക്കുന്നതിനുള്ള ഒരു ഉപകരണമാണ്.
mmseg സെഗ്മെന്റുകൾ corpus_file, അല്ലെങ്കിൽ ഫയലിന്റെ പേര് വ്യക്തമാക്കിയിട്ടില്ലെങ്കിൽ സ്റ്റാൻഡേർഡ് ഇൻപുട്ട്, എഴുതുക
സാധാരണ ഔട്ട്പുട്ടിലേക്ക് വിഭജിച്ച ഫലം.

ഓപ്ഷനുകൾ


-d DIC_File
ഉപയോഗം DIC_File നിഘണ്ടുവായി. സ്ഥിരസ്ഥിതി നിഘണ്ടു ഇവിടെ കാണാം
/usr/share/sunpinyin-slm/dict.utf8.

-f,--ഫോർമാറ്റ് (ടെക്സ്റ്റ്|ബിൻ)
ഔട്ട്‌പുട്ട് ഫോർമാറ്റ്, 'ടെക്‌സ്റ്റ്' അല്ലെങ്കിൽ 'ബിൻ' ആകാം. സ്ഥിരസ്ഥിതി 'ബിൻ'. സാധാരണയായി, ടെക്സ്റ്റ് മോഡിൽ, വാക്ക്
ടെക്സ്റ്റ് ഔട്ട്പുട്ടാണ്, ബൈനറി മോഡിൽ, വേഡ്-ഐഡികളുടെ ബൈനറി ഷോർട്ട് ഇന്റിജർ ആണ്
stdout-ന് എഴുതിയിരിക്കുന്നു.

-s, --സ്റ്റോക്ക് STOK_ID
വാക്യ ടോക്കൺ ഐഡി. ഡിഫോൾട്ട് 10. ശേഷം ബൈനറി മോഡിൽ ഔട്ട്പുട്ട് ചെയ്യാൻ ഇത് എഴുതപ്പെടും
ഓരോ വാക്യവും.

-i, --ഷോ-ഐഡി
ഐഡി വിവരം കാണിക്കുക. ടെക്സ്റ്റ് ഔട്ട്പുട്ട് ഫോർമാറ്റ് മോഡിന് കീഴിൽ, അറിയപ്പെടുന്ന വാക്കുകൾക്ക് ശേഷം ഐഡി അറ്റാച്ചുചെയ്യുക. താഴെയാണെങ്കിൽ
ബൈനറി മോഡ്, ടെക്സ്റ്റിൽ ഐഡി(കൾ) പ്രിന്റ് ചെയ്യുക.

-a, --ambiguious-id AMBI-ID
അവ്യക്തമായ അർത്ഥം ABC => A BC or AB C. വ്യക്തമാക്കിയാൽ (AMBI-ID != 0), ക്രമം ABC
ബൈനറി മോഡിൽ, സെഗ്മെന്റ് ചെയ്യപ്പെടില്ല AMBI-ID പുറത്ത് എഴുതിയിരിക്കുന്നു; ടെക്സ്റ്റ് മോഡിൽ,
" എബിസി "ഔട്ട്പുട്ട് ആയിരിക്കും. ഡിഫോൾട്ട് 0 ആണ്.

കുറിപ്പുകൾ


കീഴെ ബൈനറി മോഡ്, 0 ന്റെ തുടർച്ചയായ ഐഡി ഒന്നായി ലയിപ്പിച്ചിരിക്കുന്നു 0. താഴെ ടെക്സ്റ്റ് മോഡ്, ഇടമില്ല
അജ്ഞാത വാക്കുകൾക്കിടയിൽ ചേർത്തിരിക്കുന്നു.

onworks.net സേവനങ്ങൾ ഉപയോഗിച്ച് mmseg ഓൺലൈനായി ഉപയോഗിക്കുക



ഏറ്റവും പുതിയ ലിനക്സ്, വിൻഡോസ് ഓൺലൈൻ പ്രോഗ്രാമുകൾ