EngelsFransSpaans

Ad


OnWorks-favicon

julius - Online in de cloud

Voer julius uit in de gratis hostingprovider van OnWorks via Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Dit is de opdracht julius die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

PROGRAMMA:

NAAM


Julius
- open source multifunctionele LVCSR-engine

KORTE INHOUD


Julius [-C jconfiguratiebestand] [opties

PRODUCTBESCHRIJVING


Julius is een krachtige, multifunctionele, open-source spraakherkenningsengine voor
onderzoekers en ontwikkelaars. Het is in staat om vrijwel realtime herkenning uit te voeren
continue spraak met meer dan 60 woorden van 3 gram taalmodel en driefoon HMM-model, op de meeste
huidige pc's. Julius kan herkenning uitvoeren op audiobestanden, live microfooninvoer,
netwerkinvoer en functieparameterbestanden.

De kernherkenningsmodule is geïmplementeerd als C-bibliotheek genaamd "JuliusLib". Het kan ook zo zijn
uitgebreid met plug-in faciliteit.

ondersteunde Modellen
Julius heeft een taalmodel en een akoestisch model nodig om als spraakherkenner te kunnen functioneren. Julius
ondersteunt de volgende modellen.

Akoestisch model
Subwoord HMM (Hidden Markov Model) in HTK ascii-formaat wordt ondersteund. Foneem
modellen (monofoon), contextafhankelijke foneemmodellen (triphone), gebonden mengsel en
fonetische gebonden-mengselmodellen van elke eenheid kunnen worden gebruikt. Bij gebruik van contextafhankelijk
modellen wordt ook rekening gehouden met de contextafhankelijkheid tussen woorden. Multi-stream-functie en
MSD-HMM wordt ook ondersteund. U kunt verder een hulpmiddel gebruiken mkbinhmm om de ascii te converteren
HMM-bestand naar een compact binair formaat voor sneller laden.

Merk op dat Julius zelf kan alleen MFCC-kenmerken uit spraakgegevens extraheren. Als je gebruikt
akoestische HMM getraind voor een andere functie, moet u de invoer in de HTK-parameter opgeven
bestand van hetzelfde featuretype.

Taal model: woord N-gram
Word N-gram-taalmodel, tot 10 gram, wordt ondersteund. Julius gebruikt verschillende
N-gram voor elke doorgang: van links naar rechts 2 gram bij de eerste doorgang, en van rechts naar links N-gram bij
2e pas. Voor Julius wordt aanbevolen om zowel LR 2-gram als RL N-gram te gebruiken.
U kunt echter slechts één LR N-gram of RL N-gram gebruiken. In dat geval bij benadering
LR 2 gram, berekend op basis van het gegeven N-gram, wordt toegepast bij de eerste doorgang.

Het standaard ARPA-formaat wordt ondersteund. Bovendien is er ook een binair formaat
ondersteund voor efficiëntie. Het gereedschap mkbingram(1) kan ARPA-formaat N-gram converteren naar
binair formaat.

Taal model: Grammatica
Het grammaticaformaat is origineel en er zijn hulpmiddelen om een ​​herkenningsgrammatica te creëren
zijn bij de distributie inbegrepen. Een grammatica bestaat uit twee bestanden: één is a
'grammatica'-bestand dat zinsstructuren beschrijft in BNF-stijl, met behulp van word
'categorie'-naam als beëindigingssymbolen. Een andere is een 'voca'-bestand dat woorden definieert
met zijn uitspraken (dwz foneemreeksen) voor elke categorie. Ze zouden moeten zijn
omgezet door mkdfa(1) naar een deterministisch eindig automaatbestand (.dfa) en a
woordenboekbestand (.dict), respectievelijk. Je kunt ook meerdere grammatica's gebruiken.

Taal model: geïsoleerd woord
U kunt geïsoleerde woordherkenning uitvoeren met alleen een woordenlijst. Hiermee
modeltype, zal Julius snelle herkenning in één keer uitvoeren met statische context
afhandeling. Aan de kop en de staart van elk woord worden stiltemodellen toegevoegd. Jij kan
gebruik ook meerdere woordenboeken in een proces.

Ontdek Algoritme
Herkenningsalgoritme van Julius is gebaseerd op een twee-pass-strategie. Woord 2 gram en omgekeerd
op de betreffende pasjes wordt het woord 3-gram gebruikt. Op de eerste wordt de volledige invoer verwerkt
pass, en opnieuw wordt het laatste zoekproces opnieuw uitgevoerd voor de invoer, met behulp van de
resultaat van de eerste doorgang om de zoekruimte te verkleinen. Vooral de herkenning
Het algoritme is gebaseerd op een heuristische zoekactie met boomtraliewerk, gecombineerd met van links naar rechts
framesynchrone bundelzoekopdracht en rechts-naar-links stapeldecoderingszoekopdracht.

Bij het gebruik van contextafhankelijke telefoons (triphones) wordt rekening gehouden met interwoordcontexten
overweging. Voor modellen met gebonden mengsels en fonetische mengsels met hoge snelheid, akoestisch met hoge snelheid
Waarschijnlijkheidsberekening is mogelijk met behulp van gaussiaans snoeien.

Voor meer details, zie de gerelateerde documenten.

OPTIES


Deze opties specificeren de modellen, het systeemgedrag en verschillende zoekparameters
Julius. Deze opties kunnen worden ingesteld op de opdrachtregel, maar het wordt aanbevolen dat u schrijft
ze in een tekstbestand als een "jconf-bestand", en specificeer dit met de optie "-C".

Applicaties waarin JuliusLib is geïntegreerd, gebruiken deze opties ook om de parameters van core in te stellen
herkenningsmotor. Een jconf-bestand kan bijvoorbeeld in de machine worden geladen door aan te roepen
j_config_load_file_new() met de jconf-bestandsnaam als argument.

Houd er rekening mee dat relatieve paden in een jconf-bestand relatief moeten zijn ten opzichte van het jconf-bestand
zelf, niet de huidige werkmap.

Hieronder vindt u de details van alle opties, verzameld per groep.

Julius toepassing optie
Dit zijn toepassingsmogelijkheden van Julius, buiten JuliusLib. Het bevat parameters en
schakelaars voor resultaatuitvoer, tekensetconversie, logniveau en modulemodusopties.
Deze opties zijn specifiek voor Julius en kunnen niet worden gebruikt bij toepassingen die JuliusLib gebruiken
anders dan Julius.

-uitbestand
Bij bestandsinvoer schrijft deze optie het herkenningsresultaat van elk bestand naar een afzonderlijk bestand
bestand. Het uitvoerbestand van een invoerbestand heeft dezelfde naam, maar het achtervoegsel is
gewijzigd in ".uit". (rev.4.0)

-afzonderlijke score
Voer de taal- en akoestische partituren afzonderlijk uit.

-callbackdebug
Druk de callback-namen af ​​bij elke oproep voor foutopsporing. (rev.4.0)

-charconv oppompen van naar
Afdrukken met tekensetconversie. oppompen van is de brontekenset die wordt gebruikt in de
taalmodel, en naar is de doeltekenset die u wilt verkrijgen.

Op Linux moeten de argumenten een codenaam zijn. U kunt de lijst met beschikbare versies opvragen
codenamen door het commando "iconv --list" aan te roepen. Op Windows zouden de argumenten moeten zijn
een codenaam of codepaginanummer. De codenaam moet een van de volgende waarden zijn: "ansi", "mac", "oem",
"utf-7", "utf-8", "sjis", "euc". Of u kunt elk codepaginanummer opgeven dat wordt ondersteund op
uw omgeving.

-nocharconv
Tekenconversie uitschakelen.

-moduul [haven]
Voer Julius uit in "Server Module Mode". Na het opstarten wacht Julius op tcp/ip-verbinding
van cliënt. Zodra de verbinding tot stand is gebracht, begint Julius de communicatie met de klant
om inkomende opdrachten van de client te verwerken, of om herkenningsresultaten uit te voeren, invoer
informatie en andere systeemstatus naar de client sturen. Het standaardpoortnummer is
10500.

-record dir
Bewaar alle ingevoerde spraakgegevens automatisch in de opgegeven map. Elke gesegmenteerde ingang is dat
stuk voor stuk opgenomen. De bestandsnaam van de opgenomen gegevens wordt gegenereerd op basis van de systeemtijd
wanneer de invoer eindigt, in de stijl JJJJ.MMDD.HHMMSS.wav. Bestandsformaat is 16-bits monoraal
WAV. Ongeldig voor mfcfile-invoer.

Met invoerafwijzing door -afwijzenkort, wordt de afgewezen invoer ook geregistreerd, zelfs als
ze worden afgewezen.

-logbestand filet
Sla alle loguitvoer op in een bestand in plaats van in de standaarduitvoer. (Rev.4.0)

-noloog
Schakel alle loguitvoer uit. (Rev.4.0)

-Help
Help-bericht uitvoeren en afsluiten.

Globaal opties
Dit zijn model-/zoekafhankelijke opties met betrekking tot audio-invoer, geluidsdetectie, GMM,
decoderingsalgoritme, plug-infaciliteit en andere. Mondiale opties moeten eerder worden geplaatst
elke instantiedeclaratie (-BEN, -LMof -SR), of net na "-GLOBAAL" keuze.

Audio invoer
-invoer {mic|rawfile|mfcfile|adinnet|stdin|netaudio|alsa|oss|esd}
Kies de spraakinvoerbron. Geef 'file' of 'rawfile' op voor het golfvormbestand,
'htkparam' of 'mfcfile' voor HTK-parameterbestand. Bij bestandsinvoer zullen gebruikers dat zijn
gevraagd om de bestandsnaam van stdin in te voeren, of u kunt gebruiken -bestandslijst optie om
specificeer een lijst met bestanden die moeten worden verwerkt.

'mic' is om audio-invoer te krijgen van een standaard live microfoonapparaat, en 'adinnet'
betekent het ontvangen van golfvormgegevens via een TCPIP-netwerk van een adinnet-client.
'netaudio' is afkomstig van DatLink/NetAudio-invoer, en 'stdin' betekent gegevensinvoer van
standaard invoer.

Voor invoer van golfvormbestanden zijn alleen WAV (geen compressie) en RAW (geen header, 16 bit, groot
endian) worden standaard ondersteund. Een ander formaat kan worden gelezen wanneer het wordt gecompileerd
libsnd-bibliotheek. Raadpleeg het helpbericht om te zien welk formaat daadwerkelijk wordt ondersteund
met optie -Help. Voor stdin-invoer worden alleen WAV en RAW ondersteund. (standaard:
mfcbestand)

Bij Linux kun je tijdens runtime API kiezen door alsa, oss en esd op te geven.

-formaat van een blokje monsters
Audiofragmentgrootte in aantal samples. (standaard: 1000)

-bestandslijst bestandsnaam
(Met -invoer rawbestand|mfcbestand) voer herkenning uit op alle bestanden die worden vermeld in de
bestand. Het bestand moet een invoerbestand per regel bevatten. De motor stopt wanneer alles is uitgeschakeld
de bestanden worden verwerkt.

- geen typecontrole
Standaard controleert Julius het invoerparametertype of dit overeenkomt met AM of
niet. Deze optie schakelt de controle- en krachtengine uit om de invoervector te gebruiken
zoals het is.

-48
Neem invoer op met 48 kHz sampling en down-sampling naar 16 kHz. Dit
optie is alleen geldig voor het 16kHz-model. De down-sampling-routine is overgenomen van
spt. (Herz. 4.0)

-NA toestelnaam
Hostnaam voor DatLink-serverinvoer (-invoer netaudio).

-adporteren poortnummer
met -invoer adinnet, geef het adinnet-poortnummer op om te luisteren. (standaard: 5530)

-geen strip
Julius verwijdert standaard opeenvolgende nulmonsters in invoerspraakgegevens. Dit
optie verhindert de verwijdering.

-zgemeen , -nozgemeen
Met deze optie wordt het verwijderen van de DC-offset van de ingangsgolfvorm in-/uitgeschakeld. Compensatie zal zijn
geschat op basis van de gehele input. Voor microfoon-/netwerkinvoer: nulgemiddelde van de
de eerste 48000 samples (3 seconden bij 16 kHz sampling) zullen worden gebruikt voor de
schatting. (standaard: uitgeschakeld)

Deze optie gebruikt statische offset voor het kanaal. Zie ook -zmeanbron For
framegewijze offsetverwijdering.

Spraak opsporing by niveau en nul-kruis
-stilte , - geen stilte
Schakel de spraakdetectie in/uit via niveau en zero-cross. De standaardinstelling is ingeschakeld voor
mic/adinnet-invoer en uit voor bestanden.

-lv drie
Niveaudrempel voor detectie van spraakinvoer. Waarden moeten binnen het bereik van 0 tot liggen
32767. (standaard: 2000)

-zc drie
Nuloverschrijdingsdrempel per seconde. Alleen input die over het niveau heen gaat
drempelwaarde (-lv) wordt geteld. (standaard: 60)

-marge msec
Stiltemarge aan het begin van het spraaksegment in milliseconden. (standaard: 300)

-achtermarge msec
Stiltemarge aan het einde van het spraaksegment in milliseconden. (standaard: 400)

Invoer afwijzing
Er zijn twee eenvoudige methoden voor het afwijzen van invoer aan de voorkant geïmplementeerd, op basis van de invoerlengte
en gemiddeld vermogen van het gedetecteerde segment. De afwijzing door gemiddeld vermogen is
experimenteel, en kan worden ingeschakeld door --enable-power-reject bij compilatie. Geldig voor
MFCC-functie met alleen vermogenscoëfficiënt en real-time invoer.

Voor op GMM gebaseerde invoerafwijzing zie het GMM-gedeelte hieronder.

-afwijzenkort msec
Weiger invoer korter dan opgegeven milliseconden. Het zoeken wordt beëindigd en
er wordt geen resultaat weergegeven.

-krachtdrempels drie
Verwerp het ingevoerde segment op basis van zijn gemiddelde energie. Als de gemiddelde energie van de
laatst herkende invoer ligt onder de drempelwaarde, Julius zal de invoer afwijzen.
(Rev.4.0)

Deze optie is geldig wanneer --enable-power-reject is opgegeven bij het compileren
tijd.

Gauss mengsel model / GMM-VAD
GMM wordt gebruikt voor het afwijzen van invoer op basis van de verzamelde score, of voor front-end
Op GMM gebaseerde VAD wanneer --enable-gmm-vad is opgegeven.

OPMERKING: U moet ook de juiste MFCC-parameters instellen die vereist zijn voor de GMM,
waarbij de akoestische parameters worden gespecificeerd die worden beschreven in de AM-sectie -AM_GMM.

Wanneer op GMM gebaseerde VAD is ingeschakeld, wordt bij elke stemactiviteitsscore berekend
frame als front-endverwerking. De waarde wordt berekend als \[ \max_{m \in M_v}
p(x|m) - \max_{m \in M_n} p(x|m) \] waarbij $M_v$ een set stem-GMM is, en $M_n$ is
een set ruis-GMM's waarvan de namen moeten worden gespecificeerd door -gmmweigeren. De activiteit
De score wordt vervolgens gemiddeld voor de laatste N frames, waarbij N wordt gespecificeerd door
-gmmmarge. Julius werkt de gemiddelde activiteitsscore bij elk frame bij en detecteert
spraak-up-trigger wanneer de waarde hoger wordt dan een waarde gespecificeerd door -gmmup en
detecteert een neerwaartse trigger wanneer deze lager wordt dan een waarde van -gmmdown.

-gmm hmmdefs_bestand
GMM-definitiebestand in HTK-formaat. Indien gespecificeerd: invoerverificatie op basis van GMM
wordt gelijktijdig met de eerste doorgang uitgevoerd en u kunt de invoer afwijzen
volgens het resultaat zoals gespecificeerd door -gmmweigeren. De ALV moet worden gedefinieerd als
HMM's met één staat.

-algemeen nummer aantal
Aantal Gaussische componenten dat per frame moet worden berekend bij GMM-berekening. Alleen
de N-beste Gaussianen zullen worden berekend voor snelle berekening. De standaardwaarde is 10
en het specificeren van een kleinere waarde zal de GMM-berekening versnellen, maar een te kleine waarde
(1 of 2) kan verslechtering van de identificatieprestaties veroorzaken.

-gmmweigeren snaar
Door komma's gescheiden lijst met GMM-namen die als ongeldige invoer moeten worden afgewezen. Wanneer
Dit geldt ook voor de log-waarschijnlijkheden van GGM's die voor de gehele input zijn verzameld
gelijktijdig met de eerste doorgang worden berekend. Als de GMM-naam van de maximale score is
binnen deze string ligt, zal de tweede doorgang niet worden uitgevoerd, maar de invoer wel
verworpen.

-gmmmarge frames
(GMM_VAD) Hoofdmarge in frames. Wanneer een spraaktrigger wordt gedetecteerd door GMM,
De herkenning begint vanaf het huidige frame minus deze waarde. (Rev.4.0)

Deze optie is alleen geldig als deze is gecompileerd met --enable-gmm-vad.

-gmmup waarde
(GMM_VAD) Triggerdrempel van stemactiviteitscore omhoog. (Rev.4.1)

Deze optie is alleen geldig als deze is gecompileerd met --enable-gmm-vad.

-gmmdown waarde
(GMM_VAD) Triggerdrempel voor stemactiviteitscore omlaag. (Rev.4.1)

Deze optie is alleen geldig als deze is gecompileerd met --enable-gmm-vad.

decodering optie
Real-time verwerking betekent gelijktijdige verwerking van de MFCC-berekening bij de eerste doorgang
decoderen. Standaard is real-time verwerking op de pas ingeschakeld voor microfoon/
adinnet / netaudio-invoer, en voor anderen.

-echte tijd , -norealtime
Schakel real-time (pipe-line) verwerking expliciet in/uit bij de eerste doorgang.
De standaardinstelling is uitgeschakeld voor bestandsinvoer en ingeschakeld voor microfoon, adinnet en NetAudio
invoer. Deze optie heeft betrekking op de manier waarop CMN en energienormalisatie worden uitgevoerd:
indien uitgeschakeld, worden ze uitgevoerd met behulp van gemiddelde kenmerken van de gehele invoer. Indien ingeschakeld, MAP-CMN
en energienormalisatie om real-time verwerking uit te voeren.

Misc. opties
-C jconfiguratiebestand
Laad hier een jconf-bestand. De inhoud van het jconffile wordt hierbij uitgebreid
punt.

-versie
Druk de versie-informatie af naar de standaardfout en sluit af.

-instelling
Druk de informatie over de engine-instellingen af ​​naar de standaardfout en sluit af.

-rustig
Uitvoer minder log. Voor het resultaat wordt alleen de beste woordreeks afgedrukt.

-debuggen
(Voor debuggen) output enorme interne bericht- en debug-informatie om te loggen.

-controleren {wchmm|latwerk|trifoon}
Voor foutopsporing gaat u naar de interactieve controlemodus.

-plugindir agenda
Geef de map op waar de plug-in moet worden geladen. Als er meerdere directory's bestaan, specificeer deze dan met
door dubbele punten gescheiden lijst.

Aanleg verklaring For multi- decodering
Met de volgende argumenten wordt een nieuwe configuratieset gemaakt met standaardparameters, en
schakelstroom die erop is ingesteld. Jconf-parameters die na de optie zijn opgegeven, worden ingesteld in het
huidige set.

Om multi-model decodering uit te voeren, moeten deze argumenten aan het eerste van elk model worden gespecificeerd
/ zoek naar exemplaren met verschillende namen. Eventuele opties vóór de definitie van het eerste exemplaar
zal worden genegeerd.

Als er geen instantiedefinitie wordt gevonden (zoals in de oudere versie van Julius), zijn alle opties dat wel
toegewezen aan een standaardinstantie met de naam _default.

Houd er rekening mee dat decodering met een enkele LM en meerdere AM's niet volledig wordt ondersteund. Voor
U wilt het jconf-bestand bijvoorbeeld als volgt construeren.
Dit type modeldeling wordt nog niet ondersteund, omdat een deel van de LM-verwerking hiervan afhankelijk is
op de toegewezen AM. In plaats daarvan kunt u hetzelfde resultaat verkrijgen door voor elk dezelfde LM's te definiëren
AM, zoals dit:

-BEN naam
Maak een nieuwe AM-configuratieset en schakel de huidige over naar de nieuwe. Je moet een geven
unieke naam. (Rev.4.0)

-LM naam
Maak een nieuwe LM-configuratieset en schakel de huidige over naar de nieuwe. Je moet een geven
unieke naam. (Rev.4.0)

-SR naam ben_name lm_naam
Maak een nieuwe zoekconfiguratieset en schakel de huidige over naar de nieuwe. De opgegeven
AM en LM worden eraan toegewezen. De ben_name en lm_naam kan zowel naam als ID zijn
nummer. U moet een unieke naam opgeven. (Rev.4.0)

-AM_GMM
Wanneer u GMM gebruikt voor front-end-verwerking, kunt u GMM-specifieke akoestiek specificeren
parameters na deze optie. Als u dit niet opgeeft -AM_GMM met GMM zal de ALV dat ook doen
delen dezelfde parametervector als de laatste AM. De huidige AM wordt overgeschakeld naar de
GMM één, dus zorg ervoor dat u het niet verwart met normale AM-configuraties. (Rev.4.0)

-GLOBAAL
Start een globale sectie. De globale opties moeten vóór elke instantie worden geplaatst
aangifte, of na deze optie op meervoudige modelherkenning. Dit kan worden gebruikt
meerdere keren. (Rev.4.1)

-geensectiecontrole , -sectiecontrole
Schakel optielocatiecontrole in multi-modeldecodering uit/in. Indien ingeschakeld, wordt de
opties tussen instantiedeclaraties worden behandeld als "secties" en alleen de bijbehorende
optietypen kunnen worden geschreven. Bijvoorbeeld wanneer een optie -BEN is gespecificeerd, alleen de AM
gerelateerde optie kan na de optie worden geplaatst totdat een andere verklaring wordt gevonden. Ook,
globale opties moeten bovenaan worden geplaatst, vóór elke instantiedeclaratie. Dit is
standaard ingeschakeld. (Rev.4.1)

Taal model (-LM)
Deze groep bevat opties voor de modeldefinitie van elk taalmodeltype. Tijdens gebruik
meerdere LM's, één instance kan slechts één LM hebben.

Voor een LM-configuratie kan slechts één type LM worden opgegeven. Als je meerdere wilt gebruiken
model, moet u ze definiëren als een nieuwe LM.

N-gram
-d bingram_bestand
Gebruik het binaire formaat N-gram. Een ARPA N-gram-bestand kan worden geconverteerd naar Julius binair bestand
formaat door mkbingram.

-nlr arpa_ngram_bestand
Een voorwaarts, van links naar rechts N-gram-taalmodel in standaard ARPA-formaat. Wanneer
zowel een voorwaarts N-gram als een achterwaarts N-gram zijn gespecificeerd, Julius gebruikt dit
2 gram voorwaarts voor de eerste doorgang en N-gram achteruit voor de tweede doorgang.

Omdat het ARPA-bestand vaak groot wordt en veel tijd nodig heeft om te laden, kan dit het geval zijn
het is beter om het ARPA-bestand met mkbingram naar het binaire Julius-formaat te converteren. Let daar op
als zowel voorwaartse als achterwaartse N-gram wordt gebruikt voor herkenning, zullen ze dat samen doen
worden omgezet in een enkel binair getal.

Wanneer deze optie alleen een voorwaarts N-gram specificeert en geen achterwaarts N-gram
gespecificeerd door -nr, Julius voert herkenning uit met alleen het voorwaartse N-gram. De
Bij de eerste doorgang wordt de invoer van 1 gram in het opgegeven N-gram gebruikt, en bij de tweede doorgang wordt dat gedaan
gebruik het gegeven N-gram, waarbij de voorwaartse kansen naar achteren worden omgezet
waarschijnlijkheden volgens de regel van Bayes. (Rev.4.0)

-nr arpa_ngram_bestand
Een achterwaarts, van rechts naar links N-gram-taalmodel in standaard ARPA-formaat. Wanneer
zowel een voorwaartse N-gram als een achterwaartse N-gram zijn gespecificeerd, Julius gebruikt de voorwaartse
2 gram voor de 1e doorgang, en dit achterwaartse N-gram voor de 2e doorgang.

Omdat het ARPA-bestand vaak groot wordt en veel tijd nodig heeft om te laden, kan dit het geval zijn
het is beter om het ARPA-bestand met mkbingram naar het binaire Julius-formaat te converteren. Let daar op
als zowel voorwaartse als achterwaartse N-gram wordt gebruikt voor herkenning, zullen ze dat samen doen
worden omgezet in een enkel binair getal.

Wanneer deze optie alleen een achterwaarts N-gram specificeert en geen voorwaarts N-gram
gespecificeerd door -nlr, Julius voert herkenning uit met alleen het achterwaartse N-gram.
Bij de eerste doorgang wordt de voorwaartse waarschijnlijkheid van 1 gram gebruikt, berekend vanaf de achterwaartse richting
2 gram volgens de Bayes-regel. Bij de tweede doorgang wordt het gegeven achterwaartse N-gram volledig benut.
(Rev.4.0)

-v dict_bestand
Woordwoordenboekbestand.

-silhead woord_string -silstaart woord_string
Stiltewoord gedefinieerd in het woordenboek, voor stiltes aan het begin van
zin en einde van de zin. (standaard: " ", " ")

-mapunk woord_string
Geef een onbekend woord op. Standaard is " " of " ". Dit zal worden gebruikt om toe te wijzen
woordkans op onbekende woorden, dat wil zeggen woorden in het woordenboek die er niet in staan
N-gram woordenschat.

-iwspwoord
Voeg een woordinvoer toe aan het woordenboek dat moet overeenkomen met pauzes tussen woorden.
Dit kan de herkenningsnauwkeurigheid verbeteren in een taalmodel dat dat niet heeft
expliciete modellering van pauzes tussen woorden. De toe te voegen woordinvoer kan worden gewijzigd met
-iwspentry.

-iwspentry woord_entry_string
Geef de woordinvoer op die zal worden toegevoegd door -iwspwoord. (standaard: " [sp] sp
sp")

-tussenschot aantal
Aantal hoogfrequente woorden dat uit de lexiconboom moet worden geïsoleerd, om het gemakkelijker te maken
benaderingsfout die kan worden veroorzaakt door de beste benadering op 1e
doorgang. (standaard: 150)

Grammatica
Door herhaling kunnen meerdere grammatica's worden gespecificeerd -gram en -gramlijst. Merk op dat dit
is ongebruikelijk gedrag van andere opties (in de normale Julius-optie zal de laatste dat wel doen).
voorgaande overschrijven). Je kunt gebruiken -nogram om de grammatica al te resetten
vóór het punt gespecificeerd.

-gram gramvoorvoegsel1[,gramvoorvoegsel2[,gramvoorvoegsel3,...]]
Door komma's gescheiden lijst met te gebruiken grammatica's. het argument moet een voorvoegsel zijn van
een grammatica, dat wil zeggen als je dat hebt foo.dfa en foo.dict, moet u ze specificeren met een
enkel argument fo. Er kunnen meerdere grammatica's tegelijk worden opgegeven als a
door komma's gescheiden lijst.

-gramlijst lijst_bestand
Geef een grammaticalijstbestand op dat een lijst met te gebruiken grammatica's bevat. De lijst
bestand moet de voorvoegsels van grammatica's bevatten, elk per regel. Een relatief pad naar binnen
het lijstbestand wordt behandeld als relatief ten opzichte van het bestand, niet als het huidige pad of
configuratiebestand.

-dfa dfa_bestand -v dict_bestand
Een oude manier om grammaticabestanden afzonderlijk op te geven. Dit is nep, en dat mag niet
niet meer worden gebruikt.

-nogram
Verwijder de huidige lijst met grammatica's die al zijn opgegeven door -gram, -gramlijst, -dfa
en -v.

Geïsoleerd woord
Woordenboek kan worden opgegeven met behulp van -w en -wlijst. Wanneer u meerdere opgeeft
keer worden ze allemaal gelezen bij het opstarten. Je kunt gebruiken -nogram om de te resetten
op dat moment al gespecificeerde woordenboeken.

-w dict_bestand
Woordenwoordenboek voor geïsoleerde woordherkenning. Bestandsformaat is hetzelfde als andere
LM. (Rev.4.0)

-wlijst lijst_bestand
Geef een woordenboeklijstbestand op dat een lijst met te gebruiken woordenboeken bevat.
Het lijstbestand moet de bestandsnaam van de woordenboeken bevatten, elk per regel. A
het relatieve pad in het lijstbestand wordt behandeld als relatief ten opzichte van het lijstbestand, niet
het huidige pad of configuratiebestand. (Rev.4.0)

-nogram
Verwijder de huidige lijst met woordenboeken die al zijn opgegeven door -w en -wlijst.

-wsil head_sil_model_name staart_sil_model_naam sil_context_naam
Bij geïsoleerde woordherkenning worden stiltemodellen aan het hoofd toegevoegd
staart van elk woord bij herkenning. Deze optie geeft aan welke stiltemodellen er moeten zijn
toegevoegd. sil_context_naam is de naam van het kop-sil-model en het staart-sil-model
als context van woordhoofdtelefoon en staarttelefoon. Als u bijvoorbeeld opgeeft
-wsil silB silE sp, een woord met telefoonreeks b eh t wordt vertaald als silB
sp-b+eh b-eh+t eh-t+sp silE. (Rev.4.0)

Gebruiker gedefinieerde LM
-userlm
Verklaar dat u gebruikers-LM-functies in het programma wilt gebruiken. Deze optie moet worden gespecificeerd
als u door de gebruiker gedefinieerde LM-functies gebruikt. (Rev.4.0)

Misc. LM opties
-forcedict
Sla foutwoorden in het woordenboek over en forceer hardlopen.

Akoestisch model en kenmerken analyse (-BEN) (-AM_GMM)
Dit gedeelte gaat over opties voor akoestisch model, feature-extractie, feature
normalisaties en spectrale aftrekking.

Na de naam -AM moet een akoestisch model en de bijbehorende specificatie worden geschreven. Je kunt gebruiken
meerdere AM's getraind met verschillende MFCC-typen. Voor GMM: de vereiste parametervoorwaarde
moet net zo worden gespecificeerd als AM's erna -AM_GMM.

Bij gebruik van meerdere AM's zijn de waarden van -smpPeriode, -smpFreq, -fmaat en -fverschuiving moet
hetzelfde onder alle AM's.

Akoestisch HMM
-h hmmdef_bestand
Akoestisch HMM-definitiebestand. Het moet in HTK ascii-formaat zijn, of Julius binair
formaat. U kunt het HTK ascii-formaat naar het binaire Julius-formaat converteren met behulp van mkbinhmm.

-hlijst hmmlijst_bestand
HMMList-bestand voor telefoontoewijzing. Dit bestand biedt toewijzingen tussen logisch
triphone-namen gegenereerd in het woordenboek en de gedefinieerde HMM-namen in hmmdefs.
Deze optie moet worden opgegeven voor een contextafhankelijk model.

-tmix aantal
Geef het aantal top-Gaussianen op dat moet worden berekend in een mengselcodeboek.
Een klein getal zal de akoestische berekening versnellen, maar de AM-nauwkeurigheid kan verbeteren
erger met een te kleine waarde. Zie ook -gprune. (standaard: 2)

-spmodel naam
Geef de HMM-modelnaam op die overeenkomt met een korte pauze in een uiting. De
Ter herkenning wordt de modelnaam met korte pauze gebruikt: korte pauze overslaan
grammaticaherkenning, invoeging van het woord-einde korte pauze-model met -iwsp op N-gram,
of segmentatie met korte pauzes (-spsegment). (standaard: "sp")

-multipad
Schakel de multi-path-modus in. Om het decoderen sneller te maken, legt Julius standaard een
limiet voor HMM-overgangen waarvan elk model slechts één overgang mag hebben
begintoestand en eindtoestand. In de multi-path-modus doet Julius extra handelingen
over de overgang tussen modellen om overgangen tussen modellen en meerdere modellen mogelijk te maken
uitvoer/invoerovergangen. Merk op dat het specificeren van deze optie ervoor zorgt dat Julius een
iets langzamer, en de grotere straalbreedte kan nodig zijn.

Deze functie was een optie tijdens het compileren op Julius 3.x en wordt nu een
runtime-optie. Standaard (zonder deze optie) controleert Julius de overgang
type gespecificeerde HMM's en schakel indien nodig de multi-path-modus in. Jij kan
forceer de multi-path-modus met deze optie. (rev.4.0)

-gprune {veilig|heuristisch|straal|geen|standaard}
Stel het Gaussiaanse snoei-algoritme in dat u wilt gebruiken. Voor het gebonden mengselmodel treedt Julius op
Gaussiaans snoeien om akoestische berekeningen te verminderen, door alleen de bovenste N te berekenen
Gaussianen in elk codeboek bij elk frame. De standaardinstelling wordt ingesteld
afhankelijk van het modeltype en de motorinstelling. standaard zal acceptatie afdwingen
de standaardinstelling. Stel dit in op geen om het snoeien uit te schakelen en volledig uit te voeren
berekening. safe garandeert dat de top N Gaussianen worden berekend. heuristisch en
beam zorgt voor een agressievere reductie van de rekenkosten, maar kan resulteren in een kleine reductie
verlies van nauwkeurigheidsmodel (standaard: veilig (standaard), bundel (snel) voor gebonden mengsel
model, geen voor model zonder gebonden mengsel).

-iwcd1 {max|gem|beste nummer}
Selecteer een methode om de trifoon tussen woorden op de kop en de staart van een woord te benaderen
in de eerste doorgang.

max zal de maximale waarschijnlijkheid van tripones met dezelfde context toepassen. gemiddelde wil
pas de gemiddelde waarschijnlijkheid van tripones met dezelfde context toe. beste nummer wil
pas het gemiddelde toe van de top N-beste waarschijnlijkheden van dezelfde contexttrifoon.

De standaardwaarde is het beste 3 voor gebruik met N-gram, en gemiddeld voor grammatica en woord. Wanneer dit
AM wordt gedeeld door LM's van beide typen, de laatste zal worden gekozen.

-iwspenalty drijven
Invoegboete voor korte pauzes aan het einde van het woord, toegevoegd door -iwsp.

-gshm hmmdef_bestand
Als deze optie is opgegeven, voert Julius een Gaussiaanse mengselselectie uit
efficiënte decodering. De hmmdefs moet een monofoonmodel zijn, gegenereerd op basis van een
gewoon monofoon HMM-model, met behulp van mkgshmm.

-gsnum aantal
Geef op GMS het aantal monofoonstatussen op waarin de overeenkomstige trifoons moeten worden berekend
detail. (standaard: 24)

Spraak analyse
Alleen MFCC-functie-extractie wordt ondersteund in de huidige Julius. Dus bij het herkennen
een golfvorminvoer van bestand of microfoon, AM moet worden getraind door MFCC. De parameter
De conditie moet ook precies hetzelfde worden ingesteld als de trainingsconditie door de
onderstaande opties.

Wanneer u invoer geeft in het HTK-parameterbestand, kunt u elk parametertype gebruiken
BEN. In dit geval maakt Julius zich niet druk om het type invoerfunctie en AM
lees ze als vectorreeks en match ze met de gegeven AM. Julius controleert alleen
of de parametertypen hetzelfde zijn. Als het niet goed werkt, kunt u het uitschakelen
deze controle door - geen typecontrole.

In Julius zijn het parametertype en de kwalificaties (als TARGETKIND in HTK) en het nummer
van cepstral-parameters (NUMCEPS) worden automatisch ingesteld op basis van de inhoud van het bestand
AM-header, dus u hoeft ze niet met opties op te geven.

Andere parameters moeten precies hetzelfde worden ingesteld als de trainingsconditie. Je kan ook
geef een HTK-configuratiebestand waarmee u AM aan Julius hebt getraind -htkconf. Wanneer dit
optie wordt toegepast, zal Julius het configuratiebestand parseren en de juiste parameter instellen.

U kunt deze analyseparameterinstellingen verder insluiten in een binair HMM-bestand met behulp van
mkbinhmm.

Als opties op verschillende manieren zijn gespecificeerd, worden ze in de onderstaande volgorde geëvalueerd.
De ingebedde AM-parameter wordt, indien aanwezig, als eerste geladen. Vervolgens het HTK-configuratiebestand
gegeven door -htkconf zal worden geparseerd. Als er al een waarde is ingesteld door de AM-ingesloten waarde, wordt HTK
config zal deze overschrijven. Eindelijk worden de directe opties geladen, en dat zal ook gebeuren
eerder geladen instellingen overschrijven. Houd er rekening mee dat wanneer dezelfde opties zijn opgegeven
meerdere keren, zal later de vorige overschrijven, behalve dat -htkconf zal worden geëvalueerd
eerst zoals hierboven beschreven.

-smpPeriode periode
Bemonsteringsperiode van invoerspraak, in eenheden van 100 nanoseconden. Bemonsteringssnelheid kan
ook worden gespecificeerd door -smpFreq. Houd er rekening mee dat de ingangsfrequentie moet zijn
gelijk gesteld aan de trainingsomstandigheden van AM. (standaard: 625, komt overeen met
16,000Hz)

Deze optie komt overeen met de HTK-optie SOURCERATE. Dezelfde waarde kan zijn
aan deze optie gegeven.

Bij gebruik van meerdere AM's moet deze waarde voor alle AM's hetzelfde zijn.

-smpFreq Hz
Stel de bemonsteringsfrequentie van de invoerspraak in Hz in. De bemonsteringssnelheid kan ook zijn
gespecificeerd gebruiken -smpPeriode. Houd er rekening mee dat deze frequentie gelijk moet worden ingesteld
aan de opleidingsvoorwaarden van AM. (standaard: 16,000)

Bij gebruik van meerdere AM's moet deze waarde voor alle AM's hetzelfde zijn.

-fmaat monster_getal
Venstergrootte in aantal monsters. (standaard: 400)

Deze optie komt overeen met de HTK-optie WINDOWSIZE, maar de waarde moet in zijn
monsters (HTK-waarde / smpPeriod).

Bij gebruik van meerdere AM's moet deze waarde voor alle AM's hetzelfde zijn.

-fverschuiving monster_getal
Frameverschuiving in aantal samples. (standaard: 160)

Deze optie komt overeen met de HTK-optie TARGETRATE, maar de waarde moet in zijn
monsters (HTK-waarde / smpPeriod).

Bij gebruik van meerdere AM's moet deze waarde voor alle AM's hetzelfde zijn.

-preemph drijven
Pre-nadrukcoëfficiënt. (standaard: 0.97)

Deze optie komt overeen met de HTK-optie PREEMCOEF. Dezelfde waarde kan worden gegeven
naar deze optie.

-fbank num
Aantal filterbankkanalen. (standaard: 24)

Deze optie komt overeen met de HTK-optie NUMCHANS. Dezelfde waarde kan worden gegeven
naar deze optie. Houd er rekening mee dat de standaardwaarde niet hetzelfde is als in HTK (22).

-ceplif num
Cepstral-liftcoëfficiënt. (standaard: 22)

Deze optie komt overeen met de HTK-optie CEPLIFTER. Dezelfde waarde kan worden gegeven
naar deze optie.

-rauw , -nauw
In-/uitschakelen van het gebruik van ruwe energie vóór pre-emphasis (standaard: uitgeschakeld)

Deze optie komt overeen met de HTK-optie RAWENERGY. Houd er rekening mee dat de standaard
waarde verschilt van HTK (ingeschakeld bij HTK, uitgeschakeld bij Julius).

-normaal , -nietnormaal
Normaliserende logenergie in-/uitschakelen. Bij live-invoer zal deze normalisatie plaatsvinden
benaderd vanaf het gemiddelde van de laatste invoer. (standaard: uitgeschakeld)

Deze optie komt overeen met de HTK-optie ENORMALISE. Houd er rekening mee dat de standaard
waarde verschilt van HTK (ingeschakeld bij HTK, uitgeschakeld bij Julius).

-schaal float_schaal
Schaalfactor van logenergie bij het normaliseren van logenergie. (standaard: 1.0)

Deze optie komt overeen met de HTK-optie ESCALE. Houd er rekening mee dat de standaard
waarde verschilt van HTK (0.1).

-vloer drijven
Energiestiltevloer in dB bij het normaliseren van logenergie. (standaard: 50.0)

Deze optie komt overeen met de HTK-optie SILFLOOR.

-delwin omlijsting
Delta raamgrootte in aantal frames. (standaard: 2)

Deze optie komt overeen met de HTK-optie DELTAWINDOW. Dezelfde waarde kan zijn
aan deze optie gegeven.

- accwin omlijsting
Grootte van het versnellingsvenster in aantal frames. (standaard: 2)

Deze optie komt overeen met de HTK-optie ACCWINDOW. Dezelfde waarde kan worden gegeven
naar deze optie.

-hifreq Hz
Schakel bandbeperking in voor MFCC-filterbankberekening: stel de bovenste frequentie in
afsnijden. Met een waarde van -1 wordt dit uitgeschakeld. (standaard: -1)

Deze optie komt overeen met de HTK-optie HIFREQ. Er kan dezelfde waarde aan worden gegeven
deze optie.

-lofreq Hz
Schakel bandbeperking in voor MFCC-filterbankberekening: stel een lagere frequentie in
afsnijden. Met een waarde van -1 wordt dit uitgeschakeld. (standaard: -1)

Deze optie komt overeen met de HTK-optie LOFREQ. Er kan dezelfde waarde aan worden gegeven
deze optie.

-zgemiddeldframe , -nozgemiddeldframe
Bij spraakinvoer schakelt deze optie framegewijze verwijdering van DC-offset in/uit.
Dit komt overeen met de HTK-configuratie ZMEANSOURCE. Dit kan niet samen worden gebruikt
Met -zgemeen. (standaard: uitgeschakeld)

-gebruik kracht
Gebruik kracht in plaats van omvang bij filterbankanalyse. (standaard: uitgeschakeld)

Normalisatie
Julius kan cepstral mean normalization (CMN) voor invoer uitvoeren. CMN zal zijn
geactiveerd toen de gegeven AM werd getraind met CMN (dwz de kwalificatie "_Z" heeft in de
kop).

Het cepstrale gemiddelde wordt op verschillende manieren geschat, afhankelijk van het invoertype.
Bij bestandsinvoer wordt het gemiddelde berekend op basis van de gehele invoer. Op live-invoer dergelijke
als microfoon- en netwerkinvoer is het ceptrale gemiddelde van de invoer onbekend
begin. Er zal dus MAP-CMN worden gebruikt. Op MAP-CMN wordt een initiële gemiddelde vector toegepast
aan het begin, en de gemiddelde vector wordt uitgesmeerd tot het gemiddelde van de
het verhogen van de invoervector naarmate de invoer verloopt. Met de onderstaande opties kunt u het gedrag van
KAART-CMN.

-cvn
Normalisatie van de cepstrale variantie inschakelen. Bij bestandsinvoer de variantie van geheel
invoer wordt berekend en vervolgens toegepast. Bij live microfooningang is er een variantie van
de laatste invoer wordt toegepast. CVN wordt alleen ondersteund voor een audio-invoer.

-vtln alpha laag uitgesneden hik
Voer frequentievervorming uit, meestal voor een normalisatie van de stemkanaallengte (VTLN).
Argumenten zijn de warping-factor, hoge frequentie-afsnijding en lage frequentie. afsnijden. Zij
komen overeen met HTK Config-waarden, WARPFREQ, WARPHCUTOFF en WARPLCUTOFF.

-cmnladen filet
Laad de initiële cepstral-gemiddelde vector uit het bestand bij het opstarten. De filet zou er een moeten zijn
gered door -cmnopslaan. Door een initieel cepstraal gemiddelde te laden, kan Julius beter presteren
herkent de eerste uiting op een realtime invoer. Bij gebruik samen met
-cmnnoupdate, wordt deze initiële waarde gebruikt voor alle invoer.

-cmnopslaan filet
Sla de berekende cepstrale gemiddelde vector op in filet. De parameters worden opgeslagen
aan elk ingangseinde. Als het uitvoerbestand al bestaat, wordt het overschreven.

-cmnupdate -cmnnoupdate
Bepaal of het cepstrale gemiddelde bij elke invoer op realtime invoer moet worden bijgewerkt.
Dit uitschakelen en opgeven -cmnladen zorgt ervoor dat de motor altijd de geladen gebruikt
statisch aanvankelijk cepstraal gemiddelde.

-cmnkaartgewicht drijven
Specificeer het gewicht van het initiële cepstrale gemiddelde voor MAP-CMN. Geef een grotere waarde op
het aanvankelijke cepstrale gemiddelde voor een langere periode behouden en een kleinere waarde realiseren
het cepstrale gemiddelde is meer afhankelijk van de huidige input. (standaard: 100.0)

Front-end verwerking
Julius kan spectrale aftrekking uitvoeren om bepaalde stationaire ruis uit audio te verminderen
invoer. Hoewel het geen krachtige methode is, kan het in bepaalde situaties werken.
Julius heeft twee manieren om het ruisspectrum te schatten. Eén manier is om aan te nemen dat de eerste
Het korte segment van een spraakinvoer is het ruissegment en schat het ruisspectrum
als het gemiddelde van het segment. Een andere manier is om het gemiddelde spectrum te berekenen
alleen-ruisinvoer met behulp van een andere tool mkss, en laad deze in Julius. De voormalige wel
populair voor invoer van spraakbestanden, en laatstgenoemde zou moeten worden gebruikt bij live invoer. De opties
hieronder zal het gedrag schakelen/controleren.

-sschaal
Voer spectrale aftrekking uit met het hoofdgedeelte van elk bestand als stiltegedeelte. De
De lengte van het hoofddeel moet worden gespecificeerd door -scalclen. Alleen geldig voor bestandsinvoer.
Conflict met -ssladen.

-scalclen msec
met -sschaalspecificeert u de lengte van de hoofdstilte voor de schatting van het geluidsspectrum
in milliseconden. (standaard: 300)

-ssladen filet
Voer spectrale aftrekking uit voor spraakinvoer met behulp van een vooraf geschat geluidsspectrum
geladen vanaf filet. Het ruisspectrumbestand kan worden gemaakt door mkss. Geldig voor iedereen
spraakinvoer. Conflict met -sschaal.

-salfa drijven
Alfa-coëfficiënt van spectrale aftrekking voor -sschaal en -ssladen. Er zal lawaai zijn
sterker afgetrokken naarmate deze waarde groter wordt, maar vervorming van het resultaat
signaal wordt ook opmerkelijk. (standaard: 2.0)

-ssvloer drijven
Vloercoëfficiënt van spectrale aftrekking. De spectrale kracht die daaronder gaat
nul na aftrekking zal hierdoor door het bronsignaal worden vervangen
coëfficiënt vermenigvuldigd. (standaard: 0.5)

Misc. AM opties
-htkconf filet
Parseer het gegeven HTK-configuratiebestand en stel de overeenkomstige parameters in op Julius.
Wanneer u deze optie gebruikt, worden de standaard parameterwaarden gewijzigd van Julius
standaardinstellingen naar HTK-standaardinstellingen.

Erkenning en search (-SR)
Deze sectie bevat opties voor zoekparameters op de 1e / 2e doorgang, zoals ligger
breedte en LM-gewichten, configuraties voor segmentatie met korte pauzes, schakelaars voor woord
roosteruitvoer en verwarring netwerkuitvoer, gedwongen uitlijningen en andere gerelateerde opties
herkenningsproces en resultaatoutput.

Standaardwaarden voor bundelbreedte en LM-gewichten zullen veranderen afhankelijk van de instellingen tijdens het compileren
van JuliusLib, AM-modeltype en LM-grootte. Zie het opstartlogboek voor de actuele gegevens
waarden.

1 passeren parameters
-lmp gewicht boete
(N-gram) Gewichten van taalmodellen en boetes voor het invoegen van woorden bij de eerste passage.

-straf1 boete
(Grammatica) straf voor het invoegen van woorden bij de eerste passage. (standaard: 0.0)

-b Breedte
Bundelbreedte in aantal HMM-knooppunten voor rangschikking bij de eerste doorgang. Deze waarde
definieert de zoekbreedte bij de eerste doorgang en heeft een dominant effect op het totaal
verwerkingstijd. Een kleinere breedte versnelt de decodering, maar een te kleine waarde
zal resulteren in een substantiële toename van herkenningsfouten als gevolg van zoeken
mislukking. Een grotere waarde maakt de zoekopdracht stabiel en leidt tot een foutloze zoekopdracht
zoeken, maar de verwerkingstijd zal evenredig met de breedte toenemen.

De standaardwaarde is afhankelijk van het akoestische modeltype: 400 (monofoon), 800
(triphone), of 1000 (triphone, setup=v2.1)

-nlimiet num
Bovengrens van token per knooppunt. Deze optie is geldig wanneer --enable-wpair en
--enable-wpair-nlimit zijn ingeschakeld tijdens het compileren.

-progout
Schakel progressieve uitvoer van de deelresultaten bij de eerste doorgang in.

-proginterval msec
Stel het tijdsinterval in voor -progout in milliseconden. (standaard: 300)

2nd passeren parameters
-lmp2 gewicht boete
(N-gram) Gewichten van taalmodellen en boetes voor het invoegen van woorden voor de tweede
voorbij lopen.

-straf2 boete
(Grammatica) straf voor het invoegen van woorden bij de tweede passage. (standaard: 0.0)

-b2 Breedte
Envelopbundelbreedte (aantal hypotheses) bij de tweede doorgang. Als de telling van
woorduitbreiding bij een bepaalde hypotheselengte bereikt deze limiet tijdens zoeken,
kortere hypothesen worden niet verder uitgebreid. Dit voorkomt dat de zoekopdracht mislukt
breedte-eerst-achtige situatie stapelen op dezelfde positie, en het zoeken verbeteren
falen meestal vanwege een grote woordenschat. (standaard: 30)

-sb drijven
Breedte van de score-envelop voor omhulde scoring. Bij het berekenen van de hypothesescore
voor elke gegenereerde hypothese zal de uitbreiding van het traliewerk en de werking van Viterbi dat doen
worden in het midden van de toespraak gesnoeid als de partituur op een frame onder de breedte komt.
Als u een kleine waarde opgeeft, wordt de tweede doorgang sneller, maar er kunnen rekenfouten optreden
voorkomen. (standaard: 80.0)

-s num
Stapelgrootte, dwz het maximale aantal hypothesen dat kan worden opgeslagen op de
stapelen tijdens het zoeken. Een grotere waarde kan stabielere resultaten opleveren, maar
verhoogt de hoeveelheid vereist geheugen. (standaard: 500)

-m tellen
Aantal uitgebreide hypothesen dat nodig is om de zoekopdracht te beëindigen. Als het nummer
van uitgebreide hypothesen groter is dan deze drempel, dan is de zoektocht
op dat moment stopgezet. Hoe groter deze waarde is, des te langer Julius krijgt
het zoeken opgeven. (standaard: 2000)

-n num
Het aantal kandidaten dat Julius probeert te vinden. De zoektocht gaat tot nu toe door
Er zijn een aantal zinshypotheses gevonden. De verkregen zinshypotheses
worden gesorteerd op score en het eindresultaat wordt in volgorde weergegeven (zie ook de
-uitvoer). De mogelijkheid dat de optimale hypothese correct wordt gevonden
neemt toe naarmate deze waarde toeneemt, maar de verwerkingstijd wordt ook groter
langer. De standaardwaarde is afhankelijk van de engine-instellingen en de compilatietijd: 10
(standaard) of 1 (snel of v2.1)

-uitvoer num
De bovenste N-zinhypothese die aan het einde van de zoekopdracht moet worden uitgevoerd. Gebruiken met -n
(standaard: 1)

-zoekbereik omlijsting
Stel het aantal frames voor en na in om volgende woordhypothesen op te zoeken in de
woordlatwerk bij de tweede doorgang. Dit voorkomt het weglaten van korte woorden, maar
bij een grote waarde neemt het aantal uitgebreide hypothesen en het systeem toe
wordt langzaam. (standaard: 5)

-looklatwerk
(Grammatica) Breid alleen de woorden uit die bij de eerste passage zijn overgebleven in plaats van uit te breiden
alle woorden voorspeld door grammatica. Deze optie maakt tweede-pass-decodering mogelijk
sneller, vooral bij een grote woordenschat, maar kan de verwijdering vergroten
fout van korte woorden. (standaard: uitgeschakeld)

Korte pauze segmentatie / decoder-VAD
Wanneer gecompileerd met --enable-decoder-vad, zal de segmentatie met korte pauzes plaatsvinden
uitgebreid om op decoders gebaseerde VAD te ondersteunen.

-spsegment
Schakel de segmentatiemodus met korte pauze in. Bij een korte pauze wordt de invoer gesegmenteerd
woord (woord met alleen stiltemodel in uitspraak) krijgt de hoogste waarschijnlijkheid
bij bepaalde opeenvolgende frames tijdens de eerste doorgang. Wanneer een segmenteinde wordt gedetecteerd,
Julius stopt de eerste pas op het punt, voert de tweede pas uit en gaat verder met de volgende
segment. Het woord context zal tussen de segmenten worden beschouwd. (Rev.4.0)

Wanneer gecompileerd met --enable-decoder-vad, schakelt deze optie op de decoder gebaseerde VAD in,
lange stilte overslaan.

-spdur omlijsting
Korte pauzeduur om het einde van het invoersegment te detecteren, in aantal frames.
(standaard: 10)

-pauzemodellen snaar
Een door komma's gescheiden lijst met namen van pauzemodellen die bij een korte pauze moeten worden gebruikt
segmentatie. Het woord waarvan de uitspraak alleen uit de pauzemodellen bestaat
wordt behandeld als "pauzewoord" en gebruikt voor pauzedetectie. Indien niet gespecificeerd,
naam van -spmodel, -silhead en -silstaart zal gebruikt worden. (Rev.4.0)

-spmarge omlijsting
Backstep-marge bij trigger-up voor op decoders gebaseerde VAD. Wanneer de spraak omhoog gaat
gevonden door decoder-VAD, zal Julius de invoerparameter terugspoelen met deze waarde, en
begin met de herkenning op het punt. (Rev.4.0)

Deze optie is alleen geldig als deze is gecompileerd met --enable-decoder-vad.

-spvertraging omlijsting
Trigger-beslissingsvertragingsframe bij trigger-up voor op een decoder gebaseerde VAD. (Rev.4.0)

Deze optie is alleen geldig als deze is gecompileerd met --enable-decoder-vad.

Woord traliewerk / verwarring netwerk uitgang
-rooster , -geen rooster
In-/uitschakelen van het genereren van een woordgrafiek. Het zoekalgoritme is ook gewijzigd in
optimaliseren voor een betere generatie van woordgrafieken, zodat het zinsresultaat mogelijk niet het resultaat is
hetzelfde als normale N-beste herkenning. (Rev.4.0)

-confnet , -geenconfnet
Schakel het genereren van verwarringsnetwerk in/uit. Als u dit inschakelt, gebeurt dit ook
activeert -rooster intern. (Rev.4.0)

-grafiekbereik omlijsting
Voeg dezelfde woorden samen op de buurpositie bij het genereren van grafieken. Als de begintijd
en de eindtijd van twee woordkandidaten van hetzelfde woord ligt binnen de opgegeven tijd
bereik, worden ze samengevoegd. De standaardwaarde is 0 (samenvoegen van dezelfde woorden is toegestaan ​​op
precies dezelfde locatie) en het specificeren van een grotere waarde zal resulteren in een kleinere
grafiekuitvoer. Als u deze waarde op -1 zet, wordt het samenvoegen uitgeschakeld, in dat geval hetzelfde
woorden op dezelfde locatie met verschillende scores blijven zoals ze zijn.
(standaard: 0)

-grafieksnede diepte
Snijd de resulterende grafiek op basis van de woorddiepte in de nabewerkingsfase. De diepte
waarde is het aantal woorden dat in een frame is toegestaan. Instellen op -1 wordt uitgeschakeld
deze functie. (standaard: 80)

-graphboundloop tellen
Beperk het aantal grensaanpassingslussen in de nabewerkingsfase. Dit
parameter voorkomt dat Julius blokkeert door een oneindige aanpassingslus door kortsluiting
woord oscillatie. (standaard: 20)

-grafiekzoekvertraging , -nograafzoekvertraging
Wanneer deze optie is ingeschakeld, wijzigt Julius het algoritme voor het genereren van grafieken
de 2e keer om het zoeken niet te beëindigen door het samenvoegen van grafieken, tot de eerste zin
kandidaat wordt gevonden. Deze optie kan de nauwkeurigheid van de grafiek verbeteren, vooral als u
gaan een enorme woordgrafiek genereren door breed zoeken in te stellen. Het mag namelijk
resulteren in een betere grafieknauwkeurigheid wanneer u brede stralen instelt bij beide eerste doorgangen -b en
2e pas -b2, en groot aantal voor -n. (standaard: uitgeschakeld)

Multigram / multi-dic erkenning
-multigramuit , -geenmultigramuit
Op het gebied van grammaticaherkenning met behulp van meerdere grammatica's levert Julius alleen het beste
resultaat van alle grammatica's. Als u deze optie inschakelt, wordt Julius uitgevoerd
resultaat voor elke grammatica. (standaard: uitgeschakeld)

Gedwongen opstelling
-wallijn
Voer viterbi-uitlijning uit per woordeenheden voor het herkenningsresultaat. Het woord
grensframes en worden de gemiddelde akoestische scores per frame berekend.

-uitlijnen
Voer viterbi-uitlijning per telefooneenheid uit voor het herkenningsresultaat. De telefoon
grensframes en worden de gemiddelde akoestische scores per frame berekend.

-uitlijnen
Voer viterbi-uitlijning uit per staat voor het herkenningsresultaat. De staatsgrens
frames en de gemiddelde akoestische scores per frame worden berekend.

Misc. search opties
-inactief
Start dit exemplaar van het herkenningsproces met een inactieve status. (Rev.4.0)

-1pas
Voer alleen de eerste passage uit.

-fallback1pass
Wanneer de tweede poging mislukt, voltooit Julius de herkenning zonder resultaat. Deze optie
vertel Julius dat hij het resultaat van de eerste doorgang als eindresultaat moet weergeven bij de tweede doorgang
mislukt. Houd er rekening mee dat sommige score-uitvoer (vertrouwen enz.) mogelijk niet nuttig is. Dit was
het standaardgedrag van Julius-3.x.

-geen_ccd , -force_ccd
Schakel tijdens het zoeken expliciet over op de verwerking van telefooncontext. Normaal gesproken bepaalt Julius
of het gebruik van AM een contextafhankelijk model is of niet, uit de modelnamen,
dwz of de namen de tekens + en - bevatten. Deze optie overschrijft de
automatische detectie.

-cmalfa drijven
Afvlakkingsparameter voor het scoren van vertrouwen. (standaard: 0.05)

-iwsp
(Alleen in Multi-path-modus) Schakel contextvrije invoeging van korte pauzes tussen woorden in.
Deze optie voegt voor elk woordeinde een kort pauzemodel toe dat kan worden overgeslagen. De
korte pauze model kan worden gespecificeerd door -spmodel.

-transp drijven
Extra invoegboete voor transparante woorden. (standaard: 0.0)

-demo
Gelijkwaardig aan -progout -rustig.

MILIEU VARIABELEN


ALSADEV
(met behulp van microfooninvoer met alsa-apparaat) specificeer een naam voor het vastlegapparaat. Indien niet gespecificeerd,
"standaard" wordt gebruikt.

AUDIODEV
(met behulp van microfooninvoer met oss-apparaat) geef een pad voor het vastlegapparaat op. Indien niet gespecificeerd,
"/dev/dsp" zal gebruikt worden.

LATENCY_MSEC
Probeer de invoerlatentie van de microfooninvoer in milliseconden in te stellen. Kleinere waarde zal
verkort de latentie, maar maakt het proces soms onstabiel. De standaardwaarde is afhankelijk van de
draaiend besturingssysteem.

Voorbeelden


Voor voorbeelden van systeemgebruik raadpleegt u het tutorialgedeelte in de Julius-documenten.

KENNISGEVING


Opmerking over jconf-bestanden: relatieve paden in een jconf-bestand worden geïnterpreteerd als relatief ten opzichte van het
jconf-bestand zelf, niet naar de huidige map.

Gebruik julius online met behulp van onworks.net-services


Gratis servers en werkstations

Windows- en Linux-apps downloaden

  • 1
    Firebird
    Firebird
    Firebird RDBMS biedt ANSI SQL-functies
    & draait op Linux, Windows &
    verschillende Unix-platforms. Functies
    uitstekende gelijktijdigheid en prestaties
    & stroom...
    Firebird downloaden
  • 2
    KompoZer
    KompoZer
    KompoZer is een wysiwyg HTML-editor die gebruikt
    de Mozilla Composer-codebasis. Als
    De ontwikkeling van Nvu is gestopt
    in 2005 repareert KompoZer veel bugs en
    voegt een f toe...
    KompoZer downloaden
  • 3
    Gratis Manga Downloader
    Gratis Manga Downloader
    De gratis manga-downloader (FMD) is een
    open source applicatie geschreven in
    Object-Pascal voor het beheer van en
    manga downloaden van verschillende websites.
    Dit is een spiegel...
    Download gratis manga-downloader
  • 4
    UNetbootin
    UNetbootin
    Met UNetbootin kunt u opstartbare
    Live USB-drives voor Ubuntu, Fedora en
    andere Linux-distributies zonder
    een cd branden. Het draait op Windows, Linux,
    En ...
    UNetbootin downloaden
  • 5
    Dolibarr ERP-CRM
    Dolibarr ERP-CRM
    Dolibarr ERP - CRM is eenvoudig te gebruiken
    ERP en CRM open source softwarepakket
    (uitgevoerd met een web-php-server of als
    stand-alone software) voor bedrijven,
    fundamenten...
    Dolibarr ERP - CRM downloaden
  • 6
    SQuirreL SQL-client
    SQuirreL SQL-client
    SQuirreL SQL Client is een grafische SQL
    client geschreven in Java die het mogelijk maakt
    u om de structuur van een JDBC te bekijken
    compatibele database, blader door de gegevens in
    tafels...
    SQuirreL SQL-client downloaden
  • Meer "

Linux-commando's

Ad