Ini ialah arahan pocketsphinx_batch yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS
JADUAL:
NAMA
pocketsphinx_batch - Jalankan pengecaman pertuturan dalam mod kelompok
SINOPSIS
pocketsphinx_batch -hmm hmmdir -dikt dictfile [ pilihan ]...
DESCRIPTION
Jalankan pengecaman pertuturan ke atas senarai sebutan dalam mod kelompok. Senarai hujah
ikut:
-adchdr
Saiz pengepala fail audio dalam bait (pengepala diabaikan)
-adcin Input ialah data audio mentah
-agc Kawalan perolehan automatik untuk c0 ('maks', 'emaks', 'bunyi' atau 'tiada')
-agcthresh
Ambang awal untuk kawalan keuntungan automatik
-semua telefon
penyahkodan fonem dengan fonetik lm
-allphone_ci
Lakukan penyahkodan fonem dengan fonetik lm dan unit bebas konteks sahaja
-alfa Parameter pra-penekanan
-argfile
fail memberikan hujah tambahan.
-berskala
Songsangan skala model akustik untuk pengiraan skor keyakinan
-aw Berat songsang digunakan pada skor akustik.
-jejak belakang
Cetak keputusan dan jejak belakang ke fail log.
-rasuk Lebar pancaran digunakan pada setiap bingkai dalam carian Viterbi (nilai yang lebih kecil bermakna lebih luas
rasuk)
-path terbaik
Jalankan carian bestpath (Dijkstra) atas kekisi perkataan (laluan ke-3)
-bestpahlw
Berat kebarangkalian model bahasa untuk carian bestpath
-build_outdirs
Cipta subdirektori yang hilang dalam direktori output
-cepdir
direktori fail (diawalan pada filespecs dalam fail kawalan)
-cepext
Sambungan fail input (diakhiri dengan filespecs dalam fail kawalan)
-ceplen
Bilangan komponen dalam vektor ciri input
-cmn Skim penormalan bermakna Cepstral ('semasa', 'sebelumnya' atau 'tiada')
-cmninit
Nilai awal (dipisahkan koma) untuk min cepstral apabila 'sebelumnya' digunakan
-compallsen
Kira semua skor senone dalam setiap bingkai (boleh menjadi lebih pantas apabila terdapat banyak
senones)
-ctl fail penyenaraian ujaran untuk diproses
-ctlcount
Bilangan ujaran yang perlu diproses (selepas melangkau -ctloffset penyertaan)
-ctlincr
Lakukan setiap baris N dalam fail kawalan
-ctloffset
Bilangan ujaran di awal -ctl fail untuk dilangkau
-ctm output dalam format fail CTM (mungkin memerlukan pengisihan pasca)
-nyahpepijat tahap untuk menyahpepijat mesej
-dikt fail input kamus sebutan (leksikon).
-diktcase
Kamus sensitif huruf besar-besaran (NOTA: tidak sensitif huruf besar-besaran terpakai pada aksara ASCII
sahaja)
-gayut
Tambah bunyi 1/2-bit
-doublew
Gunakan penapis jalur lebar berganda (freq tengah yang sama)
-d Nisbah pensampelan bawah pengiraan bingkai GMM
-fdict fail input kamus sebutan perkataan
-feat Jenis aliran ciri, bergantung pada model akustik
-featparams
mengandungi parameter pengekstrakan ciri.
-fillprob
Kebarangkalian peralihan kata pengisi
-frate Frame rate
-fsg format fail tatabahasa keadaan terhingga
-fsgctl
penyenaraian fail fail FSG untuk digunakan bagi setiap ujaran
-fsgdir
direktori untuk fail FSG
-fsgext
sambungan untuk fail FSG (termasuk titik utama)
-fsgusealtpron
Tambahkan sebutan ganti pada FSG
-fsgusefiller
Sisipkan perkataan pengisi pada setiap negeri.
-fwdflat
Jalankan carian leksikon rata ke hadapan di atas kekisi perkataan (laluan ke-2)
-fwdflatbeam
Lebar pancaran digunakan pada setiap bingkai dalam carian rata laluan kedua
-fwdflatefwid
Bilangan minimum bingkai akhir untuk perkataan yang akan dicari dalam carian fwdflat
-fwdflatlw
Berat kebarangkalian model bahasa untuk penyahkodan leksikon rata (lulus ke-2).
-fwdflatsfwin
Tetingkap bingkai dalam kekisi untuk mencari perkataan pengganti dalam carian fwdflat
-fwdflatwbeam
Lebar pancaran digunakan pada perkataan keluar dalam carian rata laluan kedua
-fwdtree
Jalankan carian pokok leksikon ke hadapan (laluan pertama)
-hmm mengandungi fail model akustik.
-hyp nama fail keluaran
-hypseg
output dengan nama fail segmentasi
-input_endian
Kehebatan data input, besar atau kecil, diabaikan jika NIST atau MS Wav
-jsgf fail tatabahasa
-frasa kunci
untuk melihat
-kws fail dengan frasa kunci untuk dikesan, satu setiap baris
-kws_delay
Kelewatan untuk menunggu skor pengesanan terbaik
-kws_plp
Kebarangkalian gelung telefon untuk mengesan kata kunci
-kws_ambang
Ambang untuk nisbah p(hyp)/p(alternatif).
-berukuran laci
Saiz jadual penuding belakang awal
-lda mengandungi matriks transformasi untuk digunakan pada ciri (ciri aliran tunggal
sahaja)
-ldadim
Dimensi output transformasi ciri (0 untuk menggunakan keseluruhan matriks)
-pengangkat
Panjang lengkung dosa untuk mengangkat, atau 0 untuk tidak mengangkat.
-lm fail input model bahasa trigram
-lmctl satu set model bahasa
. -hmm and -dikt hujah sentiasa diperlukan. sama ada -lm or -fsg adalah diperlukan,
bergantung pada sama ada anda menggunakan model bahasa statistik atau tatabahasa keadaan terhingga.
Untuk melakukan pengecaman mod batch, anda perlu menentukan fail kawalan, menggunakan -ctl Ini adalah satu
fail teks ringkas yang mengandungi satu entri setiap baris. Setiap entri ialah nama fail input
relatif dengan -cepdir direktori, dan tanpa sambungan nama fail (yang diberikan dalam
yang -cepext hujah).
Jika anda menggunakan fail ciri akustik sebagai input (lihat sphinx_fe(1) untuk maklumat bagaimana
untuk menjana ini), anda juga boleh menentukan subbahagian fail, menggunakan format berikut:
NAMA FAIL RANGKA MULA RANGKA TAMAT UTTERANCE-ID
Gunakan pocketsphinx_batch dalam talian menggunakan perkhidmatan onworks.net