InggrisPerancisSpanyol

Ad


favorit OnWorks

ids2ngram - Online di Cloud

Jalankan ids2ngram di penyedia hosting gratis OnWorks melalui Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

Ini adalah perintah ids2ngram yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

PROGRAM:

NAMA


ids2ngram - menghasilkan file data n-gram dari file id

RINGKASAN


id2ngram [Option] ... id_file...

DESKRIPSI


id2ngram menghasilkan file idngram, yang merupakan array [id1,..,idN,freq] yang diurutkan, dari biner
file aliran id. Di sini, file aliran id selalu dihasilkan oleh mmseg or slmseg.
Pada dasarnya, ia menemukan semua kemunculan tupel n-kata (yaitu tupel (id1,..,idN)), dan
urutkan tupel-tupel ini menurut urutan leksikografis dari id, buat tupel, lalu tulis
mereka ke file output yang ditentukan.

INPUT


File input disajikan sebagai aliran id biner, yang terlihat seperti:
[id0,...,idX]

PILIHAN


Semua opsi berikut ini wajib.

-n,--NMax N
Menghasilkan N-gram hasil id2ngram hanya mendukung uni-gram, bi-gram, dan trigram,
jadi nomor apa pun yang tidak berada dalam kisaran 1 tidak valid.

-s,--menukar swap-file
Tentukan file perantara sementara.

-o, --keluar berkas keluaran
Tentukan file idngram hasil, misal array [id1, ..., idN, freq]

-p, --para N
Tentukan item n-gram maksimum per paragraf. id2ngram menulis ke file sementara
berdasarkan per paragraf. Setiap kali menulis paragraf, itu membebaskan
memori yang sesuai dialokasikan untuk itu. Ketika sistem komputer Anda mengizinkan, yang lebih tinggi N
disarankan. Ini dapat mempercepat kecepatan pemrosesan karena I/O yang lebih sedikit.

CONTOH


Contoh berikut akan menggunakan tiga input idstream file idsfile[1,2,3] untuk menghasilkan
idngram file all.id3gram. Setiap para (ukuran peta internal atau ukuran hash) akan menjadi 1024000,
menggunakan file swap untuk hasil temp. Semua hasil temp para pada akhirnya akan digabung menjadi got
hasil akhir.

id2ngram -n 3 -s /tmp/tukar -o all.id3gram -p 1024000 idfile1 idfile2 idfile3

Gunakan ids2ngram online menggunakan layanan onworks.net


Server & Workstation Gratis

Unduh aplikasi Windows & Linux

Perintah Linux

Ad