EnglezăFrancezăSpaniolă

Ad


Favicon OnWorks

julius - Online în cloud

Rulați julius în furnizorul de găzduire gratuit OnWorks prin Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Aceasta este comanda julius care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


Julius
- motor LVCSR multifuncțional cu sursă deschisă

REZUMAT


Julius [-C jconffile] [Opțiuni...]

DESCRIERE


Julius este un motor de înaltă performanță, multifuncțional, open-source de recunoaștere a vorbirii pentru
cercetători și dezvoltatori. Este capabil să realizeze recunoașterea aproape în timp real a
vorbire continuă cu model de limbaj de peste 60 de cuvinte de 3 grame și modelul trifon HMM, pe majoritatea
PC-urile actuale. Julius poate efectua recunoașterea fișierelor audio, intrarea microfonului live,
fișiere de intrare în rețea și parametrii caracteristici.

Modulul de recunoaștere de bază este implementat ca bibliotecă C numită „JuliusLib”. Poate fi și
extins prin facilitate de conectare.

Suportat modele
Julius are nevoie de un model de limbaj și de un model acustic pentru a rula ca dispozitiv de recunoaștere a vorbirii. Julius
suportă următoarele modele.

Acustic model
Sunt acceptate sub-cuvântul HMM (Model Markov ascuns) în format HTK ascii. Fonem
modele (monofon), modele de foneme dependente de context (trifon), tied-mixture și
pot fi utilizate modele de amestec fonetic legat de orice unitate. Când utilizați dependent de context
modele, dependența de context între cuvinte este, de asemenea, tratată. Caracteristica multi-stream și
MSD-HMM este, de asemenea, acceptat. Puteți utiliza în continuare un instrument mkbinhmm pentru a converti ascii
Fișierul HMM într-un format binar compact pentru încărcare mai rapidă.

Rețineți că Julius în sine poate extrage doar caracteristicile MFCC din datele de vorbire. Dacă utilizați
HMM acustic antrenat pentru alte caracteristici, ar trebui să dați intrarea în parametrul HTK
fișier de același tip de caracteristică.

Limbă model: cuvânt N-gram
Modelul de limbaj Word N-gram, de până la 10 grame, este acceptat. Julius folosește diferit
N-gram pentru fiecare trecere: de la stânga la dreapta 2 grame la prima trecere și de la dreapta la stânga N-gram pe
a 2-a trecere. Este recomandat să utilizați atât LR 2-gram, cât și RL N-gram pentru Julius.
Cu toate acestea, puteți utiliza doar un singur LR N-gram sau RL N-gram. În acest caz, aproximativ
LR 2 grame calculate din N-gramul dat vor fi aplicate la prima trecere.

Formatul standard ARPA este acceptat. În plus, este și un format binar
susținută pentru eficiență. Unealta mkbingram(1) poate converti formatul ARPA N-gram în
format binar.

Limbă model: gramatică
Formatul gramatical este unul original și instrumente pentru a crea o gramatică de recunoaștere
sunt incluse în distribuție. O gramatică constă din două fișiere: unul este a
fișier „gramatică” care descrie structurile propozițiilor într-un stil BNF, folosind cuvânt
numele „categoriei” ca simboluri de sfârșit. Un altul este un fișier „voca” care definește cuvinte
cu pronunțiile sale (adică secvențele de foneme) pentru fiecare categorie. Ar trebui să fie
convertit de mkdfa(1) la un fișier automat finit determinist (.dfa) și a
fișier dicționar (.dict), respectiv. De asemenea, puteți utiliza mai multe gramatici.

Limbă model: izolat cuvânt
Puteți efectua recunoașterea cuvintelor izolate folosind doar dicționarul de cuvinte. Cu asta
tip de model, Julius va efectua o recunoaștere rapidă cu o singură trecere cu context static
manipulare. Modelele de tăcere vor fi adăugate atât la cap, cât și la coada fiecărui cuvânt. Poti
utilizați, de asemenea, mai multe dicționare într-un proces.

Caută Algoritm
Algoritm de recunoaștere a Julius se bazează pe o strategie cu două treceri. Cuvânt de 2 grame și invers
cuvântul 3-gram este folosit pe trecerile respective. Întreaga intrare este procesată pe primul
trece și din nou procesul final de căutare este efectuat din nou pentru intrare, folosind
rezultatul primei treceri pentru a restrânge spațiul de căutare. Mai exact, recunoașterea
algoritmul se bazează pe o căutare euristică cu spalier combinat cu de la stânga la dreapta
căutarea fasciculului sincron cu cadru și căutarea prin decodare a stivei de la dreapta la stânga.

Când utilizați telefoane dependente de context (triphones), sunt luate în considerare contextele intercuvinte
considerare. Pentru modele cu amestecuri legate și mixturi fonetice, acustice de mare viteză
calculul probabilității este posibil folosind tăierea gaussiană.

Pentru mai multe detalii, consultați documentele aferente.

OPŢIUNI


Aceste opțiuni specifică modelele, comportamentele sistemului și diferiți parametri de căutare
Iulius. Aceste opțiuni pot fi setate la linia de comandă, dar este recomandat să scrieți
le într-un fișier text ca „fișier jconf” și specificați-l prin opțiunea „-C”.

Aplicațiile care încorporează JuliusLib folosesc, de asemenea, aceste opțiuni pentru a seta parametrii de bază
motor de recunoaștere. De exemplu, un fișier jconf poate fi încărcat în enine prin apelare
j_config_load_file_new() cu numele fișierului jconf ca argument.

Vă rugăm să rețineți că căile relative dintr-un fișier jconf ar trebui să fie relativ la fișierul jconf
în sine, nu directorul de lucru curent.

Mai jos sunt detaliile tuturor opțiunilor, adunate pe grupe.

Julius cerere opțiune
Acestea sunt opțiuni de aplicație ale lui Julius, în afara JuliusLib. Conține parametri și
comută pentru ieșirea rezultatelor, conversia setului de caractere, nivelul jurnalului și opțiunile modului modulului.
Aceste opțiuni sunt specifice lui Julius și nu pot fi utilizate la aplicațiile care utilizează JuliusLib
altul decât Julius.

-outfile
La introducerea fișierului, această opțiune scrie rezultatul recunoașterii fiecărui fișier într-un separat
fişier. Fișierul de ieșire al unui fișier de intrare va avea același nume, dar sufixul va fi
schimbat în „.out”. (rev.4.0)

-scor separat
Trimiteți separat scorurile de limbă și acustică.

-callbackdebug
Tipăriți numele de apel invers la fiecare apel pentru depanare. (rev.4.0)

-charconv din la
Imprimare cu conversie setului de caractere. din este setul de caractere sursă utilizat în
model de limbă și la este setul de caractere țintă pe care doriți să-l obțineți.

Pe Linux, argumentele ar trebui să fie un nume de cod. Puteți obține lista celor disponibile
nume de cod prin invocarea comenzii „iconv --list”. Pe Windows, argumentele ar trebui să fie
un nume de cod sau un număr de pagină de cod. Numele de cod ar trebui să fie unul dintre „ansi”, „mac”, „oem”,
„utf-7”, „utf-8”, „sjis”, „euc”. Sau puteți specifica orice număr de pagină de cod acceptat la
mediul tău.

-nocharconv
Dezactivați conversia caracterelor.

-modul [port]
Rulați Julius în „Modul modul server”. După pornire, Julius așteaptă conexiunea tcp/ip
de la client. Odată stabilită conexiunea, Julius începe comunicarea cu clientul
pentru a procesa comenzile primite de la client sau pentru a scoate rezultatele recunoașterii, intrare
informații de declanșare și alte stări ale sistemului către client. Numărul de port implicit este
10500.

-record dir
Salvați automat toate datele vorbite introduse în directorul specificat. Fiecare intrări segmentate sunt
înregistrate fiecare câte unul. Numele de fișier al datelor înregistrate este generat de la ora sistemului
când intrarea se termină, într-un stil AAAA.MMDD.HHMMSS.wav. Formatul fișierului este monoral pe 16 biți
WAV. Invalid pentru intrarea mfcfile.

Cu respingerea intrării de către -rejectscurt, intrarea respinsă va fi de asemenea înregistrată chiar dacă
sunt respinse.

-fișier jurnal fişier
Salvați toate rezultatele jurnalului într-un fișier în loc de ieșirea standard. (Rev.4.0)

-nolog
Dezactivați toate ieșirile de jurnal. (Rev.4.0)

-Ajutor
Ieșiți mesajul de ajutor și ieșiți.

Caritate Opțiuni
Acestea sunt opțiuni dependente de model/căutare referitoare la intrarea audio, detectarea sunetului, GMM,
algoritm de decodare, facilitate de plugin și altele. Opțiunile globale ar trebui plasate înainte
orice declarație de instanță (-A.M, -LM, Sau -SR), sau imediat după "-GLOBAL" opțiune.

Audio intrare
-intrare {mic|rawfile|mfcfile|adinnet|stdin|netaudio|alsa|oss|esd}
Alegeți sursa de intrare a vorbirii. Specificați „fișier” sau „fișier brut” pentru fișierul cu formă de undă,
„htkparam” sau „mfcfile” pentru fișierul cu parametrii HTK. La introducerea fișierului, utilizatorii vor fi
vi se solicită să introduceți numele fișierului din stdin sau puteți utiliza -filelist opțiunea pentru
specificați lista de fișiere de procesat.

„mic” este pentru a obține intrare audio de la un dispozitiv de microfon live implicit și „adinnet”
înseamnă primirea datelor de formă de undă prin intermediul rețelei tcpip de la un client adinnet.
„netaudio” este de la intrarea DatLink/NetAudio, iar „stdin” înseamnă intrarea de date de la
intrare standard.

Pentru introducerea fișierului cu formă de undă, numai WAV (fără compresie) și RAW (fără header, 16 biți, mare
endian) sunt acceptate implicit. Alt format poate fi citit atunci când este compilat cu
biblioteca libsnd. Pentru a vedea ce format este de fapt acceptat, consultați mesajul de ajutor
folosind opțiunea -Ajutor. Pentru intrarea stdin, sunt acceptate numai WAV și RAW. (Mod implicit:
mfcfile)

La Linux, puteți alege API în timpul rulării, specificând alsa, oss și esd.

-dimensiunea_bucăturilor probe
Dimensiunea fragmentului audio în număr de mostre. (implicit: 1000)

-filelist nume de fișier
(Cu -intrare rawfile|mfcfile) efectuează recunoașterea tuturor fișierelor enumerate în
fişier. Fișierul ar trebui să conțină fișier de intrare pe linie. Motorul se va opri când toate
dosarele sunt procesate.

-notypecheck
În mod implicit, Julius verifică tipul de parametru de intrare dacă se potrivește cu AM sau
nu. Această opțiune va dezactiva verificarea și va forța motorul să utilizeze vectorul de intrare
așa cum este.

-48
Înregistrați intrarea cu eșantionare de 48 kHz și eșantionați-o la 16 kHz din mers. Acest
opțiunea este valabilă numai pentru modelul de 16 kHz. Rutina de eșantionare redusă a fost portată din
sptk. (Apocalipsa 4.0)

-N / A Nume dispozitiv
Nume gazdă pentru intrarea serverului DatLink (-intrare netaudio).

-adport numarul portului
cu -intrare adinnet, specificați numărul portului adinnet de ascultat. (implicit: 5530)

-banda nasului
Julius elimină în mod implicit eșantioane succesive zero din datele de intrare de vorbire. Acest
opțiunea inhibă eliminarea.

-zmean , -nozmean
Această opțiune activează/dezactivează eliminarea offset-ului DC a formei de undă de intrare. Compensarea va fi
estimat din întreaga intrare. Pentru intrare microfon/rețea, media zero a
primele 48000 de mostre (3 secunde în eșantionare de 16 kHz) vor fi utilizate pentru
estimare. (implicit: dezactivat)

Această opțiune folosește decalajul static pentru canal. Vezi si -zmeansource pentru
eliminarea offset-ului în funcție de cadru.

Vorbire detectare by nivel și cruce zero
-tăcerea , -nocutinere
Activați / dezactivați detectarea vorbirii prin nivel și zero-cross. Implicit este activat pentru
intrare mic / adinnet și oprit pentru fișiere.

-lv thres
Prag de nivel pentru detectarea intrării vorbirii. Valorile ar trebui să fie în intervalul de la 0 la
32767. (implicit: 2000)

-zc thres
Pragul de trecere a zero pe secundă. Doar intrare care trece peste nivelul
prag (-lv) vor fi numărate. (implicit: 60)

-marja de cap msec
Marja de tăcere la începutul segmentului de vorbire în milisecunde. (implicit: 300)

- marginea cozii msec
Marja de tăcere la sfârșitul segmentului de vorbire în milisecunde. (implicit: 400)

Intrare respingere
Sunt implementate două metode simple de respingere a intrărilor, bazate pe lungimea intrării
și puterea medie a segmentului detectat. Respingerea prin putere medie este
experimental și poate fi activat prin --enable-power-reject la compilare. Valabil pentru
Caracteristica MFCC cu coeficient de putere și intrare numai în timp real.

Pentru respingerea intrării bazate pe GMM, consultați secțiunea GMM de mai jos.

-rejectscurt msec
Respingeți intrarea mai scurtă decât milisecundele specificate. Căutarea va fi încheiată și
nu va fi scos niciun rezultat.

-powerthres thres
Respingeți segmentul introdus cu energia sa medie. Dacă energia medie a
ultima intrare recunoscută este sub prag, Julius va respinge intrarea.
(Rev.4.0)

Această opțiune este valabilă atunci când --enable-power-reject este specificat la compilare
timp.

Gaussian amestec model / GMM-VAD
GMM va fi folosit pentru respingerea intrării prin scorul acumulat sau pentru front-end
VAD bazat pe GMM când este specificat --enable-gmm-vad.

NOTĂ: De asemenea, ar trebui să setați parametrii MFCC corespunzători necesari pentru GMM,
specificarea parametrilor acustici descriși în secțiunea AM -AM_GMM.

Când VAD bazat pe GMM este activat, scorul activității vocale va fi calculat la fiecare
cadru ca procesare front-end. Valoarea va fi calculată ca \[ \max_{m \in M_v}
p(x|m) - \max_{m \in M_n} p(x|m) \] unde $M_v$ este un set de voce GMM și $M_n$ este
un set de GMM de zgomot ale căror nume ar trebui specificate de -gmmreject. Activitatea
scorul va fi apoi mediat pentru ultimele N cadre, unde N este specificat de
-gmmmargin. Julius actualizează scorul mediu al activității la fiecare cadru și detectează
declanșarea vorbirii când valoarea devine mai mare decât valoarea specificată de -gmmup, și
detecgt down-trigger atunci când devine mai mică decât o valoare de -gmm jos.

-gmm hmmdefs_file
Fișier de definiție GMM în format HTK. Dacă este specificat, verificarea intrării bazată pe GMM
va fi efectuată concomitent cu prima trecere și puteți respinge intrarea
conform rezultatului specificat de -gmmreject. GMM ar trebui definit ca
HMM-uri cu o singură stare.

-gmmnum număr
Numărul de componente gaussiene care trebuie calculate pe cadru pe calculul GMM. Numai
cei N-cei mai buni gaussieni vor fi calculati pentru un calcul rapid. Valoarea implicită este 10
și specificarea unei valori mai mici va accelera calculul GMM, dar o valoare prea mică
(1 sau 2) poate cauza degradarea performanței de identificare.

-gmmreject şir
Lista de nume GMM, separate prin virgulă, care trebuie respinsă ca intrare nevalidă. Cand
recunoașterea, probabilitățile de log de MMG-uri acumulate pentru întreaga intrare vor
să fie calculată concomitent cu prima trecere. Dacă numele GMM a punctajului maxim
se află în acest șir, a doua trecere nu va fi executată și intrarea va fi
respins.

-gmmmargin rame
(GMM_VAD) Marja capului în cadre. Când un declanșator de vorbire este detectat de GMM,
recunoașterea va începe din cadrul curent minus această valoare. (Rev.4.0)

Această opțiune va fi valabilă numai dacă este compilată cu --enable-gmm-vad.

-gmmup valoare
(GMM_VAD) Creșteți pragul de declanșare al scorului activității vocale. (Apocalipsa 4.1)

Această opțiune va fi valabilă numai dacă este compilată cu --enable-gmm-vad.

-gmm jos valoare
(GMM_VAD) Jos pragul de declanșare al scorului activității vocale. (Apocalipsa 4.1)

Această opțiune va fi valabilă numai dacă este compilată cu --enable-gmm-vad.

Decodare opțiune
Procesarea în timp real înseamnă procesarea concomitentă a calculului MFCC prima trecere
decodare. În mod implicit, procesarea în timp real a permisului este activată pentru microfon /
intrare adinnet / netaudio, și pentru altele.

-timp real , -norealtime
Activați/dezactivați în mod explicit procesarea în timp real (conductă) la prima trecere.
Valoarea implicită este dezactivată pentru introducerea fișierelor și activată pentru microfon, adinnet și NetAudio
intrare. Această opțiune se referă la modul în care se realizează CMN și normalizarea energiei:
dacă sunt dezactivate, acestea vor fi făcute folosind caracteristicile medii ale întregii intrări. Dacă este activat, MAP-CMN
și normalizarea energiei pentru a face procesare în timp real.

Misc. Opțiuni
-C jconffile
Încărcați un fișier jconf aici. Conținutul jconffile va fi extins la aceasta
punct.

-versiune
Imprimați informațiile despre versiune la eroare standard și ieșiți.

-setare
Imprimați informațiile despre setarea motorului la eroare standard și ieșiți.

-Liniște
Ieșire mai puțin jurnal. Ca rezultat, numai cea mai bună secvență de cuvinte va fi tipărită.

- depanare
(Pentru depanare) emite un mesaj intern enorm și informații de depanare pentru a înregistra.

-Verifica {wchmm|spalier|trifon}
Pentru depanare, intrați în modul de verificare interactiv.

-plugindir dirlist
Specificați directorul pentru a încărca pluginul. Dacă există mai multe direcții, specificați-le prin
listă separată prin două puncte.

instanță declaraţie pentru Multicolor decodare
Următoarele argumente vor crea un nou set de configurații cu parametri impliciti și
comutați curentul setat la acesta. Parametrii Jconf specificați după opțiune vor fi setați în
set curent.

Pentru a face decodare multi-model, aceste argumente ar trebui specificate la primul din fiecare model
/ caută instanțe cu nume diferite. Orice opțiuni înainte de definirea primei instanțe
va fi IGNORAT.

Când nu este găsită nicio definiție a instanței (ca versiune mai veche a lui Julius), toate opțiunile sunt
atribuit unei instanțe implicite numită _default.

Vă rugăm să rețineți că decodarea cu un singur LM și mai multe AM nu este pe deplin acceptată. Pentru
exemplu, poate doriți să construiți fișierul jconf după cum urmează.
Acest tip de partajare a modelului nu este încă acceptat, deoarece o parte din procesarea LM depinde
pe AM alocat. În schimb, puteți obține același rezultat definind aceleași LM pentru fiecare
AM, așa:

-A.M nume
Creați un nou set de configurații AM și comutați curentul la cel nou. Ar trebui să dai un
nume unic. (Rev.4.0)

-LM nume
Creați un nou set de configurații LM și comutați curentul la cel nou. Ar trebui să dai un
nume unic. (Rev.4.0)

-SR nume sunt_nume lm_name
Creați un nou set de configurare de căutare și comutați curentul la cel nou. Cele specificate
AM și LM îi vor fi alocate. The sunt_nume și lm_name poate fi nume sau ID
număr. Ar trebui să dai un nume unic. (Rev.4.0)

-AM_GMM
Când utilizați GMM pentru procesarea front-end, puteți specifica acustica specifică GMM
parametrii după această opțiune. Daca nu specificati -AM_GMM cu GMM, GMM va
împărtășesc același vector de parametri ca ultimul AM. AM curentul va fi comutat pe
GMM unul, așa că aveți grijă să nu confundați cu configurațiile AM ​​normale. (Rev.4.0)

-GLOBAL
Începeți o secțiune globală. Opțiunile globale ar trebui plasate înaintea oricărei instanțe
declarație sau după această opțiune privind recunoașterea modelelor multiple. Acesta poate fi folosit
de mai multe ori. (Apocalipsa 4.1)

-verificarea nasului , -verificarea secțiunii
Dezactivați/activați opțiunea de verificare a locației în decodarea multimodel. Când este activat,
opțiunile dintre declararea instanței sunt tratate ca „secțiuni” și numai apartenența
se pot scrie tipuri de opțiuni. De exemplu, când o opțiune -A.M este specificat, doar AM
opțiunea aferentă poate fi plasată după opțiune până când se găsește altă declarație. De asemenea,
Opțiunile globale ar trebui plasate în partea de sus, înaintea oricărei declarații de instanță. Aceasta este
activat implicit. (Apocalipsa 4.1)

Limbă model (-LM)
Acest grup conține opțiuni pentru definirea modelului fiecărui tip de model de limbă. Atunci când se utilizează
LM multiple, o instanță poate avea doar un LM.

Pentru o configurație LM poate fi specificat un singur tip de LM. Dacă doriți să utilizați multi
model, ar trebui să le definiți unul ca un nou LM.

N-gram
-d fișier_bingram
Utilizați formatul binar N-gram. Un fișier ARPA N-gram poate fi convertit în binar Julius
format de mkbingram.

-nlr arpa_ngram_file
Un model de limbaj N-gram înainte, de la stânga la dreapta, în format standard ARPA. Cand
sunt specificate atât un N-gram înainte, cât și un N-gram înapoi, Julius folosește acest lucru
înainte cu 2 grame pentru prima trecere și înapoi cu N-gram pentru a doua trecere.

Deoarece fișierul ARPA devine adesea imens și necesită mult timp pentru a se încărca, poate fi
mai bine să convertiți fișierul ARPA în format binar Julius prin mkbingram. Rețineți că
dacă pentru recunoaștere se utilizează atât N-gramul înainte, cât și cel înapoi, ele vor face împreună
fi convertit într-un singur binar.

Când numai un N-gram înainte este specificat de această opțiune și nici un N-gram înapoi
specificat de - nrl, Julius efectuează recunoașterea doar cu N-gramul înainte. The
Prima trecere va folosi intrarea de 1 grame din N-gramul dat, iar a doua trecere va folosi
utilizați N-gramul dat, cu conversia probabilităților înainte în înapoi
probabilități după regula Bayes. (Rev.4.0)

- nrl arpa_ngram_file
Un model de limbaj N-gram înapoi, de la dreapta la stânga, în format standard ARPA. Cand
sunt specificate atât un N-gram înainte, cât și un N-gram înapoi, Julius folosește înainte
2-grame pentru prima trecere, iar acest N-gram înapoi pentru a 1-a trecere.

Deoarece fișierul ARPA devine adesea imens și necesită mult timp pentru a se încărca, poate fi
mai bine să convertiți fișierul ARPA în format binar Julius prin mkbingram. Rețineți că
dacă pentru recunoaștere se utilizează atât N-gramul înainte, cât și cel înapoi, ele vor face împreună
fi convertit într-un singur binar.

Când numai un N-gram înapoi este specificat de această opțiune și nici un N-gram înainte
specificat de -nlr, Julius realizează recunoașterea doar cu N-gramul înapoi.
Prima trecere va folosi probabilitatea înainte de 1 grame calculată din înapoi
2 grame folosind regula Bayes. A doua trecere folosește pe deplin N-gramul dat înapoi.
(Rev.4.0)

-v fişier_dict
Fișier dicționar de cuvinte.

-silhead șir de cuvinte -coadă șir de cuvinte
Cuvânt tăcere definit în dicționar, pentru tăceri de la începutul lui
propoziție și sfârșit de propoziție. (implicit: " ", " ")

-mapunk șir de cuvinte
Specificați cuvântul necunoscut. Implicit este " " sau " ". Acesta va fi folosit pentru a atribui
probabilitatea cuvintelor pe cuvinte necunoscute, adică cuvinte din dicționar care nu sunt în
Vocabular N-gram.

-iwspword
Adăugați o intrare de cuvânt în dicționar care ar trebui să corespundă pauzelor între cuvinte.
Acest lucru poate îmbunătăți acuratețea recunoașterii într-un model de limbă care nu are
modelarea explicită a pauzelor între cuvinte. Intrarea de cuvânt care trebuie adăugată poate fi schimbată prin
-iwspentry.

-iwspentry șir_întrare_cuvânt
Specificați intrarea de cuvânt care va fi adăugată -iwspword. (Mod implicit: " [sp] sp
sp")

-septum număr
Numărul de cuvinte de înaltă frecvență care trebuie izolate din arborele de lexic, pentru a ușura
eroare de aproximare care poate fi cauzată de cea mai bună aproximare de pe 1
trece. (implicit: 150)

Gramatică
Gramaticile multiple pot fi specificate prin repetare -gram și -gramlist. Rețineți că acest lucru
este un comportament neobișnuit de la alte opțiuni (în opțiunea normală Julius, ultima va
le depășesc pe cele anterioare). Poți să folosești -nogramă pentru a reseta deja gramaticile
specificat înainte de punct.

-gram gramprefix1[,gramprefix2[,gramprefix3,...]]
Lista de gramatici, separată prin virgulă, care trebuie utilizată. argumentul ar trebui să fie un prefix al
o gramatică, adică dacă ai foo.dfa și foo.dict, ar trebui să le specificați cu a
singur argument foo. Mai multe gramatici pot fi specificate simultan ca a
listă separată prin virgulă.

-gramlist list_file
Specificați un fișier cu listă de gramatici care conține o listă de gramatici care vor fi utilizate. Lista
fișierul ar trebui să conțină prefixele gramaticale, fiecare pe rând. O cale relativă în
fișierul listă va fi tratat ca fiind relativ la fișier, nu calea curentă sau
Fișier de configurare.

-dfa dfa_file -v fişier_dict
Un mod vechi de a specifica fișierele gramaticale separat. Acest lucru este fals și nu ar trebui
mai fi folosit.

-nogramă
Eliminați lista curentă de gramatici deja specificate de -gram, -gramlist, -dfa
și -v.

Izolat cuvânt
Dicționarul poate fi specificat utilizând -w și -wlist. Când specificați multiplu
ori, toate vor fi citite la pornire. Poți să folosești -nogramă pentru a reseta
dicționare deja specificate la acel moment.

-w fişier_dict
Dicționar de cuvinte pentru recunoașterea cuvintelor izolate. Formatul de fișier este același cu celălalt
LM. (Rev.4.0)

-wlist list_file
Specificați un fișier cu listă de dicționare care conține lista de dicționare care vor fi utilizate.
Fișierul listă ar trebui să conțină numele fișierului dicționarelor, fiecare pe linie. A
calea relativă din fișierul listă va fi tratată ca fiind relativă la fișierul listă, nu
calea curentă sau fișierul de configurare. (Rev.4.0)

-nogramă
Eliminați lista curentă de dicționare deja specificate de -w și -wlist.

-wsil head_sil_model_name tail_sil_model_name sil_context_name
La recunoașterea cuvintelor izolate, modelele de tăcere vor fi atașate la cap și
coada fiecărui cuvânt la recunoaștere. Această opțiune specifică modelele de tăcere care urmează să fie
anexat. sil_context_name este numele modelului head sil și tail sil model
ca context al cuvântului headphone și tail phone. De exemplu, dacă specificați
-wsil silB silE sp, un cuvânt cu secvență de telefon b eh t va fi tradus ca silB
sp-b+eh b-eh+t eh-t+sp silE. (Rev.4.0)

Definit de utilizator LM
-userlm
Declarați că utilizați funcțiile LM ale utilizatorului în program. Această opțiune ar trebui specificată
dacă utilizați funcții LM definite de utilizator. (Rev.4.0)

Misc. LM Opțiuni
-forțată
Omite cuvintele de eroare din dicționar și forță rularea.

Acustic model și trăsătură analiză (-A.M) (-AM_GMM)
Această secțiune este despre opțiuni pentru modelul acustic, extragerea caracteristicilor, caracteristică
normalizări și scăderi spectrale.

După numele -AM, trebuie scris un model acustic și specificația aferentă. Poți să folosești
mai mulți AM instruiți cu diferite tipuri de MFCC. Pentru GMM, condiția de parametru necesară
ar trebui să fie specificate la fel ca AM după -AM_GMM.

Când utilizați mai multe AM, valorile de -smpPeriod, -smpFreq, -fsize și -fshift ar trebui să fie
la fel între toate AM.

Acustic HMM
-h hmmdef_file
Fișier de definiție HMM acustic. Ar trebui să fie în format HTK ascii sau Julius binary
format. Puteți converti formatul HTK ascii în format binar Julius folosind mkbinhmm.

-hlist hmmlist_file
Fișier HMMList pentru maparea telefonului. Acest fișier oferă mapare între logice
nume de triphone generate în dicționar și numele HMM definite în hmmdefs.
Această opțiune ar trebui specificată pentru modelul dependent de context.

-tmix număr
Specificați numărul de gaussieni de top care trebuie calculat într-o carte de coduri de amestec.
Numărul mic va accelera calculul acustic, dar precizia AM poate obține
mai rău cu valoare prea mică. Vezi si -gprune. (implicit: 2)

-spmodel nume
Specificați numele modelului HMM care corespunde pauzei scurte într-un enunț. The
Numele modelului cu pauză scurtă va fi folosit în recunoaștere: săritura pe pauză scurtă
recunoaștere gramaticală, inserare model cu sfârșit de cuvânt cu pauză scurtă -iwsp pe N-gram,
sau segmentare pe pauză scurtă (-spsegment). (implicit: "sp")

-multipath
Activați modul cu mai multe căi. Pentru a face decodarea mai rapidă, Julius impune implicit a
limita tranzițiilor HMM de la care fiecare model ar trebui să aibă o singură tranziție
starea inițială și la starea finală. În modul cu mai multe căi, Julius face o manipulare suplimentară
pe tranziția inter-model pentru a permite tranziția sărituri de model și multiple
tranziții de ieșire/intrare. Rețineți că specificarea acestei opțiuni îl va face pe Julius a
puțin mai lent și poate fi necesară o lățime mai mare a fasciculului.

Această funcție a fost o opțiune de compilare pe Julius 3.x și acum devine a
opțiunea de rulare. În mod implicit (fără această opțiune), Julius verifică tranziția
tipul de HMM specificate și activați modul cu mai multe căi dacă este necesar. Poti
forțați modul cu mai multe căi cu această opțiune. (rev.4.0)

-gprune {sigur|euristic|faz|niciuna|implicit}
Setați algoritmul de tăiere gaussian pe care să îl utilizați. Pentru modelul cu amestec legat, Julius face performanță
Tunderea gaussiană pentru a reduce calculul acustic, prin calcularea numai a Nului superior
Gaussieni în fiecare carte de coduri la fiecare cadru. Setarea implicită va fi setată
în funcție de tipul de model și de setarea motorului. implicit va forța acceptarea
setarea implicită. Setați această opțiune la niciunul pentru a dezactiva tăierea și a funcționa complet
calcul. safe garantează că primii N gaussieni vor fi calculati. euristic şi
fascicul face o reducere mai agresivă a costurilor de calcul, dar poate avea ca rezultat un mic
model de pierdere a preciziei (implicit: sigur (standard), fascicul (rapid) pentru amestecul legat
model, niciunul pentru modelul fără amestec).

-iwcd1 {max|mediu|cel mai bun număr}
Selectați metoda pentru a aproxima trifonul între cuvinte pe capul și coada unui cuvânt
în prima trecere.

max va aplica probabilitatea maximă a trifonelor din același context. vointa medie
aplicați probabilitatea medie a trifonelor din același context. cel mai bun număr va
aplicați media celor mai bune N-cele mai bune probabilități ale aceluiași trifon context.

Implicit este cel mai bun 3 pentru utilizarea cu N-gram și avg pentru gramatică și cuvânt. Când aceasta
AM este partajat de LM-uri de ambele tipuri, acesta din urmă va fi ales.

-iwsppenalty pluti
Penalizare de inserare pentru pauzele scurte de la sfârșitul cuvântului adăugată de -iwsp.

-gshmm hmmdef_file
Dacă se specifică această opțiune, Julius efectuează Selectarea amestecului Gaussian pentru
decodare eficientă. Hmmdefs ar trebui să fie un model de monofon generat dintr-un
model obișnuit de monofon HMM, folosind mkgshmm.

-gsnum număr
Pe GMS, specificați numărul de stări de monofon pentru a calcula trifoanele corespunzătoare
detaliu. (implicit: 24)

Vorbire analiză
Numai extragerea caracteristicilor MFCC este acceptată în Julius actual. Astfel la recunoaștere
o intrare de formă de undă din fișier sau microfon, AM trebuie instruit de MFCC. Parametrul
condiția ar trebui, de asemenea, setată exact la fel ca și condiția de antrenament de către
opțiunile de mai jos.

Când dați o intrare în fișierul de parametri HTK, puteți utiliza orice tip de parametru pentru
A.M. În acest caz, Julius nu-i pasă de tipul de caracteristică de intrare și AM, doar
citiți-le ca secvență vectorială și potriviți-le cu AM dat. Julius doar verifică
dacă tipurile de parametri sunt aceleași. Dacă nu funcționează bine, puteți dezactiva
această verificare de către -notypecheck.

În Julius, tipul parametrului și calificatorii (ca TARGETKIND în HTK) și numărul
a parametrilor cepstrali (NUMCEPS) vor fi setati automat din continutul
Antetul AM, deci nu trebuie să le specificați prin opțiuni.

Alți parametri ar trebui setați exact la fel ca și condiția de antrenament. Poti de asemenea
dați un fișier HTK Config pe care l-ați folosit pentru a-l antrena pe AM pe Julius -htkconf. Când aceasta
este aplicată opțiunea, Julius va analiza fișierul de configurare și va seta parametrul corespunzător.

Puteți încorpora în continuare acele setări ale parametrilor de analiză într-un fișier binar HMM folosind
mkbinhmm.

Dacă opțiunile sunt specificate în mai multe moduri, acestea vor fi evaluate în ordinea de mai jos.
Parametrul AM încorporat va fi încărcat mai întâi, dacă este cazul. Apoi, fișierul de configurare HTK
dat de -htkconf va fi analizat. Dacă o valoare deja setată de valoarea încorporată AM, HTK
config le va suprascrie. În cele din urmă, opțiunile directe vor fi încărcate, ceea ce va
anulează setările încărcate anterior. Rețineți că, atunci când sunt specificate aceleași opțiuni
de mai multe ori, mai târziu va înlocui anterior, cu excepția faptului că -htkconf vor fi evaluate
mai întâi așa cum este descris mai sus.

-smpPeriod perioadă
Perioada de eșantionare a vorbirii de intrare, în unitate de 100 nanosecunde. Rata de eșantionare poate
fi specificat de asemenea de -smpFreq. Vă rugăm să rețineți că frecvența de intrare ar trebui să fie
stabilite egale cu condițiile de antrenament ale AM. (implicit: 625, corespunde cu
16,000 Hz)

Această opțiune corespunde opțiunii HTK SOURCERATE. Aceeași valoare poate fi
dat acestei opțiuni.

Când utilizați mai multe AM, această valoare ar trebui să fie aceeași între toate AM.

-smpFreq Hz
Setați frecvența de eșantionare a vorbirii de intrare în Hz. Rata de eșantionare poate fi, de asemenea
specificat folosind -smpPeriod. Vă rugăm să rețineți că această frecvență trebuie setată egală
la condiţiile de pregătire ale AM. (implicit: 16,000)

Când utilizați mai multe AM, această valoare ar trebui să fie aceeași între toate AM.

-fsize sample_num
Dimensiunea ferestrei în număr de mostre. (implicit: 400)

Această opțiune corespunde opțiunii HTK WINDOWSIZE, dar valoarea ar trebui să fie în
mostre (valoarea HTK / smpPeriod).

Când utilizați mai multe AM, această valoare ar trebui să fie aceeași între toate AM.

-fshift sample_num
Schimbarea cadrului în numărul de mostre. (implicit: 160)

Această opțiune corespunde opțiunii HTK TARGETRATATE, dar valoarea ar trebui să fie în
mostre (valoarea HTK / smpPeriod).

Când utilizați mai multe AM, această valoare ar trebui să fie aceeași între toate AM.

-preempf pluti
Coeficientul de pre-accentuare. (implicit: 0.97)

Această opțiune corespunde Opțiunii HTK PREEMCOEF. Aceeași valoare poate fi dată
la această opțiune.

-fbank o
Numărul de canale filterbank. (implicit: 24)

Această opțiune corespunde opțiunii HTK NUMCHANS. Aceeași valoare poate fi dată
la această opțiune. Rețineți că valoarea implicită nu este aceeași ca în HTK (22).

-ceplif o
Coeficientul de ridicare cepstrală. (implicit: 22)

Această opțiune corespunde Opțiunii HTK CEPLIFTER. Aceeași valoare poate fi dată
la această opțiune.

-rawe , -norawe
Activați/dezactivați utilizarea energiei brute înainte de pre-accentuare (implicit: dezactivat)

Această opțiune corespunde Opțiunii HTK RAWENERGY. Rețineți că implicit
valoarea diferă de HTK (activat la HTK, dezactivat la Julius).

-enormal , -noenormal
Activați/dezactivați normalizarea energiei jurnalului. La intrare live, această normalizare va fi
aproximată din media ultimei intrări. (implicit: dezactivat)

Această opțiune corespunde opțiunii HTK ENORMALISE. Rețineți că implicit
valoarea diferă de HTK (activat la HTK, dezactivat la Julius).

-scale float_scale
Factorul de scalare al energiei log la normalizarea energiei log. (implicit: 1.0)

Această opțiune corespunde opțiunii HTK ESCALE. Rețineți că implicit
valoarea diferă de HTK (0.1).

-pardoseala pluti
Nivelul de liniște energetică în dB la normalizarea energiei jurnalului. (implicit: 50.0)

Această opțiune corespunde Opțiunii HTK SILFLOOR.

-Delwin cadru
Dimensiunea ferestrei Delta în număr de cadre. (implicit: 2)

Această opțiune corespunde opțiunii HTK DELTAWINDOW. Aceeași valoare poate fi
dat acestei opțiuni.

-Accwin cadru
Dimensiunea ferestrei de accelerare în număr de cadre. (implicit: 2)

Această opțiune corespunde opțiunii HTK ACCWINDOW. Aceeași valoare poate fi dată
la această opțiune.

-hifreq Hz
Activați limitarea benzii pentru calculul filterbank MFCC: setați frecvența superioară
a tăia calea. Valoarea -1 o va dezactiva. (implicit: -1)

Această opțiune corespunde opțiunii HTK HIFREQ. Aceeași valoare i se poate acorda
această opțiune.

-lofreq Hz
Activați limitarea benzii pentru calculul filterbank MFCC: setați frecvența mai mică
a tăia calea. Valoarea -1 o va dezactiva. (implicit: -1)

Această opțiune corespunde opțiunii HTK LOFREQ. Aceeași valoare i se poate acorda
această opțiune.

-zmeanframe , -nozmeanframe
Cu intrarea vorbirii, această opțiune activează/dezactivează eliminarea offset-ului DC în funcție de cadru.
Aceasta corespunde configurației HTK ZMEANSOURCE. Acest lucru nu poate fi folosit împreună
cu -zmean. (implicit: dezactivat)

-puterea de utilizare
Utilizați puterea în loc de mărime pentru analiza filterbank. (implicit: dezactivat)

Normalizare
Julius poate efectua normalizarea medie cepstrală (CMN) pentru intrări. CMN va fi
activat atunci când AM dat a fost antrenat cu CMN (adică are calificativul „_Z” în
antet).

Media cepstrală va fi estimată în mod diferit în funcție de tipul de intrare.
La introducerea fișierului, media va fi calculată din întreaga intrare. La intrare live astfel
ca intrare pentru microfon și rețea, media ceptrală a intrării este necunoscută la
start. Deci va fi folosit MAP-CMN. Pe MAP-CMN, se va aplica un vector mediu inițial
la început, iar vectorul mediu va fi acoperit cu media
incrementând vectorul de intrare pe măsură ce trece intrarea. Opțiunile de mai jos pot controla comportamentul
HARTĂ-CMN.

-cvn
Activați normalizarea varianței cepstrale. La introducerea fișierului, variația întregului
intrarea va fi calculată și apoi aplicată. La intrarea microfonului live, variație de
se va aplica ultima intrare. CVN este acceptat numai pentru o intrare audio.

-vtln alfa decoltat hicut
Efectuați deformarea frecvenței, de obicei pentru o normalizare a lungimii tractului vocal (VTLN).
Argumentele sunt factorul de deformare, decuplarea frecvenței înalte și frecvența joasă. a tăia calea. ei
corespund valorilor HTK Config, WARPFREQ, WARPHCUTOFF și WARPLCUTOFF.

-cmnload fişier
Încărcați vectorul mediu cepstral inițial din fișier la pornire. The fişier ar trebui să fie unul
salvat de -cmnsave. Încărcarea unui mijloc cepstral inițial îi permite lui Julius să facă mai bine
recunoașteți primul enunț pe o intrare în timp real. Când este utilizat împreună cu
-cmnnoupdate, această valoare inițială va fi utilizată pentru toate intrările.

-cmnsave fişier
Salvați vectorul mediu cepstral calculat în fişier. Parametrii vor fi salvați
la fiecare capăt de intrare. Dacă fișierul de ieșire există deja, acesta va fi suprascris.

-cmnupdate -cmnnoupdate
Controlați dacă actualizați media cepstrală la fiecare intrare pe intrare în timp real.
Dezactivând acest lucru și specificând -cmnload va face motorul să folosească întotdeauna cel încărcat
medie cepstrală inițială statică.

-cmnmapweight pluti
Specificați greutatea mediei cepstrale inițiale pentru MAP-CMN. Specificați o valoare mai mare pentru
păstrați media cepstrală inițială pentru o perioadă mai lungă și o valoare mai mică de făcut
media cepstrală se bazează mai mult pe intrarea curentă. (implicit: 100.0)

În față prelucrare
Julius poate efectua scăderea spectrală pentru a reduce zgomotul staționar din sunet
intrare. Deși nu este o metodă puternică, dar poate funcționa în anumite situații.
Julius are două moduri de a estima spectrul de zgomot. O modalitate este să presupunem că prima
segmentul scurt al unei intrări de vorbire este un segment de zgomot și estimați spectrul de zgomot
ca medie a segmentului. O altă modalitate este de a calcula spectrul mediu de la
intrare numai zgomot folosind alt instrument mkss și încărcați-l în Julius. Primul este
popular pentru introducerea fișierelor de vorbire, iar acesta din urmă ar trebui să fie utilizat în intrarea live. Opțiunile
de mai jos va comuta/controla comportamentul.

-sscalc
Efectuați scăderea spectrală folosind partea de cap a fiecărui fișier ca parte de tăcere. The
lungimea părții capului trebuie specificată de -sscalclen. Valabil numai pentru introducerea fișierului.
Conflict cu -ssload.

-sscalclen msec
cu -sscalc, specificați lungimea tăcerii capului pentru estimarea spectrului de zgomot
în milisecunde. (implicit: 300)

-ssload fişier
Efectuați scăderea spectrală pentru intrarea vorbirii folosind spectrul de zgomot pre-estimat
încărcat din fişier. Fișierul spectrului de zgomot poate fi realizat de mkss. Valabil pentru toti
intrarea vorbirii. Conflict cu -sscalc.

-ssalpha pluti
Coeficientul alfa de scădere spectrală pentru -sscalc și -ssload. Zgomotul va fi
scade mai puternic pe măsură ce această valoare devine mai mare, dar distorsiunea rezultată
semnalul devine de asemenea remarcabil. (implicit: 2.0)

-ssfloor pluti
Coeficientul de pardoseală de scădere spectrală. Puterea spectrală care coboară mai jos
zero după scădere va fi înlocuit de semnalul sursă cu acesta
coeficient multiplicat. (implicit: 0.5)

Misc. AM Opțiuni
-htkconf fişier
Analizați fișierul HTK Config dat și setați parametrii corespunzători lui Julius.
Când utilizați această opțiune, valorile implicite ale parametrilor sunt comutate de la Julius
implicit la valorile implicite HTK.

Recunoaștere proces și căutare (-SR)
Această secțiune conține opțiuni pentru parametrii de căutare la prima / a doua trecere, cum ar fi fasciculul
lățime și greutăți LM, configurații pentru segmentare pe pauză scurtă, comutatoare pentru cuvânt
ieșire rețea și confuzie ieșire rețea, aliniamente forțate și alte opțiuni legate
procesul de recunoaștere și rezultatul rezultat.

Valorile implicite pentru lățimea fasciculului și greutățile LM se vor schimba în funcție de configurarea timpului de compilare
de JuliusLib , tipul de model AM și dimensiunea LM. Vă rugăm să consultați jurnalul de pornire pentru a afla actualul
valori.

1 trece parametrii
-lmp greutate penalizare
(N-gram) Greutățile modelului de limbă și penalizările de inserare a cuvintelor pentru prima trecere.

- pedeapsa 1 penalizare
(Gramatică) penalizare pentru introducerea cuvintelor pentru prima trecere. (implicit: 0.0)

-b lățime
Lățimea fasciculului în numărul de noduri HMM pentru rangul fasciculului la prima trecere. Această valoare
definește lățimea de căutare la prima trecere și are un efect dominant asupra totalului
timp de procesare. Lățimea mai mică va accelera decodarea, dar o valoare prea mică
va avea ca rezultat o creștere substanțială a erorilor de recunoaștere datorate căutării
eșec. O valoare mai mare va face căutarea stabilă și va duce la fără eșecuri
căutare, dar timpul de procesare va crește proporțional cu lățimea.

Valoarea implicită depinde de tipul modelului acustic: 400 (monofon), 800
(trifon) sau 1000 (trifon, configurare=v2.1)

-nlimit o
Limita superioară a jetonului per nod. Această opțiune este valabilă când --enable-wpair și
--enable-wpair-nlimit sunt activate la momentul compilarii.

-progout
Activați ieșirea progresivă a rezultatelor parțiale la prima trecere.

-proginterval msec
Setați intervalul de timp pentru -progout în milisecunde. (implicit: 300)

2 trece parametrii
-lmp2 greutate penalizare
(N-gram) Greutățile modelului de limbă și penalizările de inserare a cuvintelor pentru al doilea
trece.

- pedeapsa 2 penalizare
(Gramatică) penalizare pentru introducerea cuvintelor pentru a doua pasă. (implicit: 0.0)

-b2 lățime
Lățimea fasciculului plic (numărul de ipoteze) la a doua trecere. Dacă numărul de
extinderea cuvintelor la o anumită lungime a ipotezei atinge această limită în timpul căutării,
ipotezele mai scurte nu sunt extinse mai departe. Acest lucru împiedică căutările să cadă
situație asemănătoare lățimii mai întâi stivuind pe aceeași poziție și îmbunătățiți căutarea
eșec mai ales pentru condiția de vocabular mare. (implicit: 30)

-sb pluti
Lățimea plicului de scor pentru notarea în plic. La calcularea scorului ipotezei
pentru fiecare ipoteză generată, extinderea ei spalier și funcționarea Viterbi vor
fi tăiat în mijlocul discursului dacă scorul pe un cadru scade sub lățimea.
Oferirea unei valori mici face ca a doua trecere să fie mai rapidă, dar este posibilă o eroare de calcul
apar. (implicit: 80.0)

-s o
Dimensiunea stivei, adică numărul maxim de ipoteze care pot fi stocate pe
stivă în timpul căutării. O valoare mai mare poate da rezultate mai stabile, dar
crește cantitatea de memorie necesară. (implicit: 500)

-m conta
Numărul de ipoteze extinse necesare pentru a întrerupe căutarea. Dacă numărul
de ipoteze extinse este mai mare decât acest prag, atunci căutarea este
întrerupt în acel moment. Cu cât această valoare este mai mare, cu atât Julius ajunge mai mult
renunta la cautare. (implicit: 2000)

-n o
Numărul de candidați pe care Julius încearcă să găsească. Căutarea continuă până acum
au fost găsite numărul de ipoteze de propoziție. Ipotezele propoziției obținute
sunt sortate după scor, iar rezultatul final este afișat în ordine (a se vedea, de asemenea,
-ieșire). Posibilitatea ca ipoteza optimă să fie corect găsită
crește pe măsură ce această valoare crește, dar și timpul de procesare devine
mai lung. Valoarea implicită depinde de setarea motorului la timpul de compilare: 10
(standard) sau 1 (rapid sau v2.1)

-ieșire o
Ipoteza de sus N propoziție va fi scoasă la sfârșitul căutării. Foloseste cu -n
(implicit: 1)

-gamă de căutare cadru
Setați numărul de cadre înainte și după pentru a căuta ipotezele următoarelor cuvinte în
spalier de cuvinte la a doua trecere. Acest lucru previne omiterea cuvintelor scurte, dar
cu o valoare mare, numărul de ipoteze extinse crește și sistem
devine lent. (implicit: 5)

-looktrellis
(Gramatică) Extindeți numai cuvintele care au supraviețuit la prima trecere în loc să se extindă
toate cuvintele prezise de gramatică. Această opțiune face decodarea a doua trecere
mai rapid, mai ales pentru condiția de vocabular mare, dar poate crește ștergerea
eroarea cuvintelor scurte. (implicit: dezactivat)

Scurtă pauză segmentarea / decodor-VAD
Când este compilat cu --enable-decoder-vad, segmentarea pe pauză scurtă va fi
extins pentru a suporta VAD bazat pe decodor.

-spsegment
Activați modul de segmentare cu pauză scurtă. Intrarea va fi segmentată la o scurtă pauză
cuvântul (cuvântul cu doar model de tăcere în pronunție) are cea mai mare probabilitate
la anumite cadre succesive la prima trecere. Când se detectează sfârșitul segmentului,
Julius oprește prima trecere la punct, efectuează a doua trecere și continuă cu următoarea
segment. Cuvântul context va fi luat în considerare printre segmente. (Rev.4.0)

Când este compilată cu --enable-decoder-vad, această opțiune activează VAD bazat pe decodor,
a sări peste tăcerea lungă.

-spdur cadru
Durata scurtă a pauzei pentru a detecta sfârșitul segmentului de intrare, în număr de cadre.
(implicit: 10)

-modele de pauză şir
O listă de nume de modele de pauză, separate prin virgulă, pentru a fi utilizate la pauză scurtă
segmentare. Cuvântul a cărui pronunție constă numai din modelele de pauză
va fi tratat ca „cuvânt de pauză” și folosit pentru detectarea pauzei. Dacă nu este specificat,
numele -spmodel, -silhead și -coadă va fi folosit. (Rev.4.0)

-spmargin cadru
Marja de pas înapoi la declanșare pentru VAD bazat pe decodor. Când vorbirea se declanșează
găsit de decodor-VAD, Julius va derula înapoi parametrul de intrare cu această valoare și
începe recunoașterea la punct. (Rev.4.0)

Această opțiune va fi valabilă numai dacă este compilată cu --enable-decoder-vad.

-spdelay cadru
Cadrul de întârziere a deciziei de declanșare la declanșare pentru VAD bazat pe decodor. (Rev.4.0)

Această opțiune va fi valabilă numai dacă este compilată cu --enable-decoder-vad.

Cuvânt zăbrele / confuzie reţea producție
-zăbrele , -nolattice
Activați/dezactivați generarea graficului de cuvinte. Algoritmul de căutare s-a schimbat și în
optimizați pentru o generare mai bună a graficului de cuvinte, astfel încât rezultatul propoziției poate să nu fie
la fel ca și recunoașterea N-best normală. (Rev.4.0)

-confnet , -noconfnet
Activați/dezactivați generarea rețelei de confuzie. Activarea acestui lucru va fi, de asemenea
activează -zăbrele intern. (Rev.4.0)

-gamă grafică cadru
Îmbină aceleași cuvinte la poziția vecină la generarea graficului. Dacă ora de început
iar ora de încheiere a două cuvinte candidate a aceluiași cuvânt este în limitele specificate
interval, acestea vor fi îmbinate. Valoarea implicită este 0 (permite îmbinarea acelorași cuvinte pe
exact aceeași locație) și specificarea unei valori mai mari va avea ca rezultat mai mică
ieșire grafică. Setarea acestei valori la -1 va dezactiva îmbinarea, în acest caz aceeași
cuvintele de pe aceeași locație a unor scoruri diferite vor fi lăsate așa cum sunt.
(implicit: 0)

-decupare grafică adâncime
Tăiați graficul rezultat după adâncimea cuvântului în etapa de post-procesare. Adâncimea
valoare este numărul de cuvinte care trebuie permis la un cadru. Setarea la -1 dezactivează
această caracteristică. (implicit: 80)

-graphboundloop conta
Limitați numărul de bucle de ajustare a limitei în etapa de post-procesare. Acest
parametrul împiedică pe Julius să se blocheze prin bucla de reglare infinită prin scurtcircuit
oscilația cuvântului. (implicit: 20)

-întârzierea căutării grafice , -întârzierea căutării nografului
Când această opțiune este activată, Julius își modifică algoritmul de generare a graficului
a 2-a trecere pentru a nu termina căutarea prin îmbinare grafică, până la prima propoziție
candidatul este găsit. Această opțiune poate îmbunătăți acuratețea graficului, mai ales atunci când dvs
vor genera un grafic de cuvinte uriaș prin setarea căutării ample. Și anume, s-ar putea
rezultă o precizie mai bună a graficului atunci când setați fascicule largi la ambele treceri -b și
a 2-a trecere -b2, și număr mare pentru -n. (implicit: dezactivat)

Multi-gram / multi-dic recunoaştere
-multigramout , -nomultigramout
La recunoașterea gramaticală folosind mai multe gramatici, Julius va scoate numai cele mai bune
rezultat printre toate gramaticile. Activarea acestei opțiuni va face ca Julius să iasă
rezultat pentru fiecare gramatică. (implicit: dezactivat)

Forțat aliniere
-walign
Faceți alinierea viterbi pe unități de cuvânt pentru rezultatul recunoașterii. Cuvantul
se vor calcula cadrele de delimitare și scorurile acustice medii pe cadru.

-palign
Faceți alinierea viterbi pe unități de telefon pentru rezultatul recunoașterii. Telefonul
se vor calcula cadrele de delimitare și scorurile acustice medii pe cadru.

-salign
Faceți alinierea viterbi pe stare pentru rezultatul recunoașterii. Granița de stat
cadre și se vor calcula scorurile acustice medii pe cadru.

Misc. căutare Opțiuni
-inactiv
Porniți această instanță a procesului de recunoaștere cu starea inactivă. (Rev.4.0)

-1 trecere
Efectuați doar prima trecere.

-fallback1pass
Când a 2-a pasă eșuează, Julius termină recunoașterea fără niciun rezultat. Această opțiune
spune-i lui Julius să scoată rezultatul primei pasi ca rezultat final când a doua trecere
eșuează. Rețineți că unele rezultate ale scorului (încrederea etc.) pot să nu fie utile. Acesta a fost
comportamentul implicit al lui Julius-3.x.

-nu_ccd , -force_ccd
Comutați explicit gestionarea contextului telefonului la căutare. În mod normal, Julius determină
dacă utilizarea AM este un model dependent de context sau nu din numele modelului,
adică dacă numele conțin caractere + și -. Această opțiune va înlocui
detecție automată.

-cmalfa pluti
Parametru de netezire pentru scorul de încredere. (implicit: 0.05)

-iwsp
(Numai modul cu mai multe căi) Activați inserarea de scurte pauze fără context între cuvinte.
Această opțiune adaugă un model de pauză scurtă care poate fi ignorat pentru fiecare sfârșit de cuvânt. The
modelul cu pauză scurtă poate fi specificat de -spmodel.

-transp pluti
Penalizare suplimentară de inserare pentru cuvinte transparente. (implicit: 0.0)

-demo
Echivalentă cu -progout -Liniște.

MEDIUL VARIABILE


ALSADEV
(folosind intrarea microfonului cu dispozitivul alsa) specificați un nume de dispozitiv de captură. Dacă nu este specificat,
se va folosi „implicit”.

AUDIODEV
(folosind intrarea microfonului cu dispozitivul oss) specificați o cale pentru dispozitivul de captură. Dacă nu este specificat,
"/dev/dsp" va fi folosit.

LATENCY_MSEC
Încercați să setați latența de intrare a microfonului în milisecunde. Valoarea mai mică va
scurtează latența, dar uneori face procesul instabil. Valoarea implicită va depinde de
rulează OS.

EXEMPLE


Pentru exemple de utilizare a sistemului, consultați secțiunea tutorial din documentele Julius.

ANUNȚ


Notă despre fișierele jconf: căile relative dintr-un fișier jconf sunt interpretate ca fiind relative la
jconf în sine, nu în directorul curent.

Utilizați Julius online folosind serviciile onworks.net


Servere și stații de lucru gratuite

Descărcați aplicații Windows și Linux

  • 1
    Firebird
    Firebird
    Firebird RDBMS oferă caracteristici ANSI SQL
    și rulează pe Linux, Windows și
    mai multe platforme Unix. Caracteristici
    concurență și performanță excelente
    & putere...
    Descărcați Firebird
  • 2
    KompoZer
    KompoZer
    KompoZer este un editor HTML wysiwyg care utilizează
    baza de cod Mozilla Composer. La fel de
    Dezvoltarea Nvu a fost oprită
    în 2005, KompoZer remediază multe erori și
    adaugă un f...
    Descărcați KompoZer
  • 3
    Descărcător gratuit de manga
    Descărcător gratuit de manga
    Free Manga Downloader (FMD) este un
    aplicație open source scrisă în
    Object-Pascal pentru gestionarea și
    descărcarea manga de pe diverse site-uri web.
    Aceasta este o oglindă...
    Descărcați gratuit Manga Downloader
  • 4
    UNetbootin
    UNetbootin
    UNetbootin vă permite să creați bootable
    Unități USB live pentru Ubuntu, Fedora și
    alte distribuții Linux fără
    arderea unui CD. Se rulează pe Windows, Linux,
    şi ...
    Descărcați UNetbootin
  • 5
    Dolibarr ERP - CRM
    Dolibarr ERP - CRM
    Dolibarr ERP - CRM este ușor de utilizat
    Pachetul software ERP și CRM open source
    (rulați cu un server web php sau ca
    software autonom) pentru companii,
    fundatii...
    Descărcați Dolibarr ERP - CRM
  • 6
    Client SQL SQuirreL
    Client SQL SQuirreL
    SQuirreL SQL Client este un SQL grafic
    client scris în Java care va permite
    pentru a vizualiza structura unui JDBC
    baza de date conformă, răsfoiți datele în
    Mese...
    Descărcați SQuirreL SQL Client
  • Mai mult »

Comenzi Linux

Ad