Ini adalah perintah mkbingram yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
mkbingram
- buat biner N-gram dari file ARPA N-gram
RINGKASAN
mkbingram [-nlr maju_ngram.arpa] [-nrl mundur_ngram.arpa] [-D file_bingram_lama]
{output_bingram_file}
DESKRIPSI
mkbingram adalah alat untuk mengonversi file definisi N-gram dalam format standar ARPA menjadi a
format biner Julius kompak. Ini akan mempercepat waktu pemuatan awal N-gram banyak
lebih cepat. Itu dapat membaca file gzip secara langsung.
Dari rev.4.0, Julius dapat menangani N-gram maju, N-gram mundur dan kombinasinya.
Jadi, mkbingram sekarang menghasilkan file N-gram biner dari salah satunya, atau menggabungkan keduanya untuk
menghasilkan satu N-gram biner.
Ketika hanya N-gram maju yang ditentukan, mkbingram menghasilkan N-gram biner hanya dari
maju N-gram. Saat menggunakan N-gram biner ini di Julius, ia melakukan operan pertama dengan
Peluang 2 gram dalam N-gram, dan jalankan lintasan ke-2 dengan N-gram yang diberikan sepenuhnya, dengan
mengubah probabilitas maju menjadi probabilitas mundur dengan aturan Bayes.
Ketika hanya N-gram mundur yang ditentukan, mkbingram menghasilkan file N-gram biner yang
hanya berisi N-gram mundur. Pass pertama akan menggunakan probabilitas maju 1 gram yang
dapat dihitung dari 2-gram mundur menggunakan aturan Bayes, dan lintasan ke-2 menggunakan yang diberikan
mundur N-gram sepenuhnya.
Ketika N-gram maju dan mundur ditentukan, bagian 2-gram di depan
N-gram dan semua N-gram terbelakang akan digabungkan menjadi satu file bingram. depan
2-gram akan diterapkan untuk lintasan pertama dan N-gram mundur untuk lintasan kedua. Perhatikan bahwa
kedua N-gram harus dilatih dalam korpus yang sama dengan parameter yang sama (yaitu cut-off
ambang batas), dengan kosakata yang sama.
N-gram biner lama yang dihasilkan oleh mkbingram dari versi 3.x dan sebelumnya dapat digunakan di
Julius-4, tetapi Anda dapat mengonversi versi lama ke versi baru dengan menetapkannya sebagai input
arus mkbingram dengan pilihan"-d".
Harap dicatat bahwa file N-gram biner dikonversi oleh mkbingram versi 4.0 dan yang lebih baru tidak bisa
dibaca oleh Julius 3.x yang lebih tua.
PILIHAN
-nlr maju_ngram.arpa
Baca dalam file N-gram kata maju (kiri-ke-kanan) dalam format standar ARPA.
-nrl mundur_ngram.arpa
Baca dalam file N-gram kata mundur (kanan-ke-kiri) dalam format standar ARPA.
-d file_bingram_lama
Baca dalam file N-gram biner.
-menukar
Tukar kata BOS dan kata EOS dalam N-gram.
keluaran_bingram_file
nama file N-gram biner ke output.
CONTOH
Konversi satu set N-gram maju dan mundur dalam format ARPA ke dalam bentuk biner Julius:
Konversikan satu forward 4 gram dalam format ARPA menjadi file biner:
Konversikan file N-gram biner lama ke format saat ini:
Gunakan mkbingram online menggunakan layanan onworks.net
