EnglishFrenchSpanyol

Ad


Favicon OnWorks

mmseg - Dalam talian di Awan

Jalankan mmseg dalam penyedia pengehosan percuma OnWorks melalui Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS

Ini ialah perintah mmseg yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.

JADUAL:

NAMA


mmseg - segmen padanan maksimum teks Cina.

SINOPSIS


mmseg -d dict_file [pilihan]... [corpus_file]...

DESCRIPTION


mmseg ialah alat untuk membahagikan teks Cina kepada perkataan menggunakan algoritma padanan maksimum.
mmseg segmen corpus_file, atau input standard jika tiada nama fail dinyatakan, dan tulis
keputusan dibahagikan kepada output standard.

PILIHAN


-d dict_file
Penggunaan dict_file sebagai leksikon. Leksikon lalai boleh didapati di
/usr/share/sunpinyin-slm/dict.utf8.

-f,--format (teks|bin)
Format Output, boleh menjadi 'teks' atau 'bin'. 'bin' lalai. Biasanya, dalam mod teks, perkataan
teks adalah output, manakala dalam mod binari, integer pendek binari kata-id ialah
ditulis kepada stdout.

-s, --stok STOK_ID
id token ayat. Lalai 10. Ia akan ditulis kepada output dalam mod binari selepas
setiap ayat.

-i, --show-id
Tunjukkan maklumat Id. Di bawah mod format output teks, lampirkan id selepas perkataan yang diketahui. Jika di bawah
mod binari, cetak id(s) dalam teks.

-a, --ambiguious-id AMBI-ID
Ambik maksud ABC => A BC or AB C. Jika dinyatakan (AMBI-ID != 0), Urutan ABC
tidak akan dibahagikan, dalam mod binari, yang AMBI-ID ditulis; dalam mod teks,
" ABC " akan menjadi output. Lalai ialah 0.

NOTA


Di bawah perduaan mod, id berturut-turut 0 digabungkan menjadi satu 0. Di bawah teks mod, tiada ruang
disisipkan di antara perkataan yang tidak diketahui.

Gunakan mmseg dalam talian menggunakan perkhidmatan onworks.net


Pelayan & Stesen Kerja Percuma

Muat turun apl Windows & Linux

Arahan Linux

Ad