англійськафранцузькаіспанська

Ad


Значок OnWorks

julius - онлайн в хмарі

Запустіть julius у постачальника безкоштовного хостингу OnWorks через Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

Це команда julius, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

ПРОГРАМА:

ІМ'Я


Джуліус
- багатоцільовий двигун LVCSR з відкритим кодом

СИНТАКСИС


Джуліус [-C jconffile] [опції...]

ОПИС


Джуліус — це високопродуктивний багатоцільовий механізм розпізнавання мовлення з відкритим кодом
дослідники та розробники. Він здатний розпізнавати майже в режимі реального часу
безперервна мова з більш ніж 60 тис. слів 3-грамовою моделлю мови та трифонною моделлю HMM, на більшості
поточні ПК. Джуліус може виконувати розпізнавання аудіофайлів, живий мікрофонний вхід,
файли мережевого введення та параметрів функцій.

Основний модуль розпізнавання реалізований як бібліотека C під назвою «JuliusLib». Це також може бути
розширений за допомогою плагінів.

Підтриманий моделі
Джуліус потребує мовної та акустичної моделі, щоб працювати як розпізнавач мовлення. Джуліус
підтримує наступні моделі.

Акустичний модель
Підслів HMM (прихована модель Маркова) у форматі HTK ascii підтримуються. фонема
моделі (монофон), контекстно-залежні моделі фонем (трифон), прив’язані-мікс і
Можуть використовуватися фонетичні змішані моделі будь-якої одиниці. При використанні залежно від контексту
моделей, також обробляється залежність від контексту між словами. Багатопотокова функція і
Також підтримується MSD-HMM. Далі можна використовувати інструмент mkbinhmm для перетворення ascii
Файл HMM у компактний двійковий формат для пришвидшого завантаження.

Зверніть увагу, що Джуліус сама може витягувати функції MFCC лише з мовних даних. Якщо ви використовуєте
акустичний HMM, навчений для інших функцій, ви повинні ввести вхідний параметр HTK
файл того самого типу функції.

Language модель: слово N-грам
Підтримується мовна модель Word N-грам, вагою до 10 грам. Юлій використовує різні
N-грам для кожного проходу: зліва направо 2-грама на 1-му проході та справа наліво N-грам на
2-й прохід. Рекомендується використовувати як LR 2-грам, так і RL N-грам для Julius.
Однак ви можете використовувати лише один LR N-грам або RL N-грам. У такому випадку приблизно
LR 2-грама, обчислена з заданого N-грама, буде застосована при першому проході.

Підтримується стандартний формат ARPA. Крім того, це також двійковий формат
підтримується для ефективності. Інструмент mkbingram(1) може конвертувати формат ARPA N-грам у
двійковий формат.

Language модель: граматика
Формат граматики оригінальний, а також інструменти для створення граматики розпізнавання
включені в розподіл. Граматика складається з двох файлів: один є a
"граматичний" файл, який описує структури речень у стилі BNF, використовуючи слово
Ім'я категорії як кінцеві символи. Іншим є файл "voca", який визначає слова
з його вимовою (тобто послідовностями фонем) для кожної категорії. Вони повинні бути
конвертовано за допомогою mkdfa(1) до детермінованого файлу кінцевих автоматів (.dfa) і a
файл словника (.dict), відповідно. Ви також можете використовувати кілька граматик.

Language модель: ізольований слово
Ви можете виконати розпізнавання ізольованих слів, використовуючи лише словник слів. З цим
типу моделі, Julius виконуватиме швидке розпізнавання за один прохід зі статичним контекстом
обробки. Моделі мовчання будуть додані як у голові, так і в хвості кожного слова. Ти можеш
також використовувати кілька словників у процесі.

Пошук Алгоритм
Алгоритм розпізнавання Джуліус заснована на стратегії двох проходів. Слово 2-грамове і зворотне
на відповідних перепустках використовується слово 3-грам. Весь вхід обробляється на першому
перейти, і знову виконується остаточний процес пошуку для вхідних даних, використовуючи
результат першого проходу, щоб звузити простір пошуку. Зокрема, визнання
Алгоритм заснований на евристичній решітці дерева в поєднанні з пошуком зліва направо
кадрово-синхронний пошук променів і пошук декодування стека справа наліво.

При використанні контекстно-залежних телефонів (трифонів) враховуються контексти міжслів
розгляд. Для моделей із зв’язаною сумішшю та фонетичною сумішшю, високошвидкісний акустичний
Розрахунок ймовірності можливий за допомогою обрізки Гаусса.

Щоб отримати докладнішу інформацію, дивіться відповідні документи.

ВАРІАНТИ


Ці параметри визначають моделі, поведінку системи та різні параметри пошуку
Юлій. Ці параметри можна встановити в командному рядку, але рекомендується написати
у текстовому файлі як "файл jconf" і вкажіть його за допомогою параметра "-C".

Програми, що включають JuliusLib, також використовують ці параметри для встановлення параметрів ядра
двигун розпізнавання. Наприклад, файл jconf можна завантажити в enine за допомогою виклику
j_config_load_file_new() з іменем файлу jconf як аргументом.

Зверніть увагу, що відносні шляхи у файлі jconf мають бути відносно файлу jconf
сам по собі, а не поточний робочий каталог.

Нижче наведено деталі всіх варіантів, зібраних групами.

Юлій додатку варіант
Це варіанти програми Julius, поза межами JuliusLib. Він містить параметри і
перемикачі для виведення результату, перетворення набору символів, рівня журналу та параметрів режиму модуля.
Ці параметри специфічні для Julius і не можуть використовуватися в програмах, які використовують JuliusLib
крім Юлія.

- вихідний файл
Під час введення файлу цей параметр записує результат розпізнавання кожного файлу в окремий файл
файл. Вихідний файл вхідного файлу матиме те саме ім'я, але суфікс буде таким
змінено на ".out". (версія 4.0)

- роздільний бал
Виведіть мову та акустичні партитури окремо.

- callbackdebug
Друкуйте імена зворотного виклику під час кожного виклику для налагодження. (версія 4.0)

-charconv від до
Друк із перетворенням набору символів. від це вихідний набір символів, який використовується в
мовна модель і до це цільовий набір символів, який ви хочете отримати.

У Linux аргументи мають бути кодовою назвою. Ви можете отримати список доступних
кодові імена, викликавши команду "iconv --list". У Windows аргументи повинні бути
кодове ім'я або номер кодової сторінки. Кодове ім'я має бути одним із "ansi", "mac", "oem",
"utf-7", "utf-8", "sjis", "euc". Або ви можете вказати будь-який номер кодової сторінки, який підтримується на
ваше оточення.

-nocharconv
Вимкнути перетворення символів.

- модуль [порт]
Запустіть Julius у «Режимі серверного модуля». Після запуску Julius чекає підключення tcp/ip
від клієнта. Після встановлення з’єднання Юліус починає спілкуватися з клієнтом
для обробки вхідних команд від клієнта або для виведення результатів розпізнавання, введення
інформацію про запуск та інший стан системи для клієнта. Номер порту за замовчуванням
10500.

-запис реж
Автоматичне збереження всіх вхідних мовних даних у вказаний каталог. Кожен сегментований входи є
записані кожен по одному. Ім'я файлу записаних даних генерується з системного часу
коли введення закінчується, у стилі РРРР.ММДД.ЧЧММСС.wav. Формат файлу 16-бітовий моноральний
WAV. Недійсний для введення mfcfile.

З відхиленням введення -відкинути короткий, відхилений вхід також буде записаний, навіть якщо
вони відхилені.

-файл журналу файл
Збережіть весь вихідний журнал у файл замість стандартного виводу. (Rev.4.0)

-нолог
Вимкнути весь вихід журналу. (Rev.4.0)

-допомога
Вивести довідкове повідомлення та вийти.

Глобальний опції
Це параметри, що залежать від моделі/пошуку, що стосуються введення аудіо, виявлення звуку, GMM,
алгоритм декодування, плагін та інші. Глобальні опції слід розмістити раніше
будь-яка декларація екземпляра (, -LMабо -СР), або відразу після "- ГЛОБАЛЬНИЙ".

аудіо вхід
-вхід {mic|rawfile|mfcfile|adinnet|stdin|netaudio|alsa|oss|esd}
Виберіть джерело мовлення. Вкажіть "файл" або "rawfile" для файлу сигналу,
'htkparam' або 'mfcfile' для файлу параметрів HTK. При введенні файлу користувачі будуть
буде запропоновано ввести ім’я файлу зі стандартного входу, або ви можете скористатися - список файлів варіант до
вказати список файлів для обробки.

«мікрофон» — це отримувати аудіовхід із мікрофонного пристрою за замовчуванням, а «adinnet»
означає отримання даних форми сигналу через мережу tcpip від клієнта adinnet.
"netaudio" - це вхід DatLink/NetAudio, а "stdin" означає введення даних з
стандартний вхід.

Для введення файлу сигналу лише WAV (без стиснення) і RAW (без заголовка, 16 біт, великий
endian) підтримуються за замовчуванням. Інший формат можна прочитати під час компіляції з
бібліотека libsnd. Щоб дізнатися, який формат насправді підтримується, перегляньте повідомлення довідки
використання опції -допомога. Для введення stdin підтримуються лише WAV і RAW. (за замовчуванням:
mfcfile)

У Linux ви можете вибрати API під час виконання, вказавши alsa, oss і esd.

-розмір_частинки зразки
Розмір аудіо фрагмента в кількості семплів. (за замовчуванням: 1000)

- список файлів ім'я файлу
-вхід rawfile|mfcfile) виконати розпізнавання всіх файлів, перерахованих у
файл. Файл повинен містити вхідний файл на рядок. Двигун закінчиться, коли все з
файли обробляються.

-notypecheck
За замовчуванням Julius перевіряє тип вхідного параметра, чи відповідає він AM або
ні. Ця опція вимкне перевірку та змусить двигун використовувати вхідний вектор
як є.

-48
Записуйте вхідний сигнал із частотою дискретизації 48 кГц і знижуйте його до 16 кГц на льоту. Це
Опція дійсна лише для моделі 16 кГц. Процедура пониження вибірки була перенесена з
sptk. (Редакція 4.0)

-НІ Ім'я пристрою
Ім’я хоста для введення сервера DatLink (-вхід netaudio).

-адпорт номер_порту
з -вхід adinnet, вкажіть номер порту adinnet для прослуховування. (за замовчуванням: 5530)

- смужка
Julius за замовчуванням видаляє послідовні нульові вибірки у вхідних мовних даних. Це
опція гальмує видалення.

-мати на увазі , -нозмеан
Ця опція вмикає/виключає видалення зсуву постійного струму вхідного сигналу. Залік буде
оцінюється з усього вхідного. Для мікрофонного / мережевого входу нульове середнє значення
для
оцінка. (за замовчуванням: вимкнено)

Цей параметр використовує статичний зсув для каналу. Дивись також -zmeansource та цінності
видалення зміщення по кадру.

Мова виявлення by рівень та нульовий хрест
- різання , -безшумність
Вмикайте / вимикайте розпізнавання мовлення за рівнем і нульовим перехрестом. За умовчанням увімкнено для
mic/adinnet вхід і вимкнено для файлів.

-лв thres
Поріг рівня для виявлення мовного введення. Значення мають бути в діапазоні від 0 до
32767. (за замовчуванням: 2000)

-zc thres
Нульовий поріг перетину за секунду. Тільки вхідні дані, які перевищують рівень
поріг (-лв) буде зараховано. (за замовчуванням: 60)

- головне поле мсек
Запас мовчання на початку сегмента мовлення в мілісекундах. (за замовчуванням: 300)

- хвостовий край мсек
Запас мовчання в кінці сегмента мовлення в мілісекундах. (за замовчуванням: 400)

вхід відмова
Реалізовано два простих методу відхилення вхідного інтерфейсу на основі довжини введення
і середня потужність виявленого сегмента. Відбракування за середньою потужністю є
експериментальний, і його можна ввімкнути за допомогою --enable-power-reject під час компіляції. Діє для
Функція MFCC лише з коефіцієнтом потужності та введенням у реальному часі.

Про відхилення введення на основі GMM див. розділ GMM нижче.

-відкинути короткий мсек
Відхилити введення менше зазначених мілісекунд. Пошук буде припинено і
результату не буде.

-потужність thres
Відкиньте введений відрізок за його середньою енергією. Якщо середня енергія
останній розпізнаний вхід нижче порогового значення, Julius відхилить вхід.
(Rev.4.0)

Цей параметр дійсний, якщо під час компіляції вказано --enable-power-reject
часу.

Гауссія суміш модель / GMM-VAD
GMM використовуватиметься для відхилення введення за накопиченою оцінкою або для інтерфейсу
VAD на основі GMM, коли вказано --enable-gmm-vad.

ПРИМІТКА. Ви також повинні встановити належні параметри MFCC, необхідні для GMM,
визначення акустичних параметрів, описаних у розділі AM -AM_GMM.

Коли ввімкнено VAD на основі GMM, оцінка голосової активності буде розрахована для кожного
рамка як фронтальна обробка. Значення буде обчислено як \[ \max_{m \in M_v}
p(x|m) - \max_{m \in M_n} p(x|m) \] де $M_v$ – набір голосових GMM, а $M_n$ – це
набір шумових GMM, назви яких мають бути визначені -gmmreject. Діяльність
оцінка буде потім усереднена для останніх N кадрів, де N визначається як
-gmmmargin. Julius оновлює усереднений показник активності в кожному кадрі та виявляє
активатор мовлення, коли значення стає вище за значення, зазначене в -gmmup та
detecgt тригер вниз, коли воно стає нижчим за значення -gmmdown.

-гмм hmmdefs_файл
Файл визначення GMM у форматі HTK. Якщо вказано, перевірка введених даних на основі GMM
буде виконуватися одночасно з 1-м проходом, і ви можете відхилити введення
відповідно до результату, зазначеного в -gmmreject. GMM слід визначити як
однодержавні HMM.

-гммнум номер
Кількість гаусових компонентів, які підлягають обчисленню на кадр під час обчислення GMM. Тільки
для швидкого обчислення будуть обчислені N-кращі коефіцієнти Гаусса. За замовчуванням – 10
а вказування меншого значення прискорить обчислення GMM, але занадто мале значення
(1 або 2) може призвести до погіршення ефективності ідентифікації.

-gmmreject рядок
Відокремлений комами список імен GMM, які потрібно відхилити як недійсні дані. Коли
розпізнавання, журнал ймовірності GMM, накопичений для всього вхідного буде
обчислюється одночасно з 1-м проходом. Якщо ім'я GMM має максимальний бал
знаходиться всередині цього рядка, 2-й перехід не буде виконано, а введення буде
відхилено.

-gmmmargin кадри
(GMM_VAD) Поле головки в кадрах. Коли GMM виявляє активатор мовлення,
розпізнавання розпочнеться з поточного кадру мінус це значення. (Rev.4.0)

Цей параметр буде дійсним, лише якщо він скомпільований з --enable-gmm-vad.

-gmmup значення
(GMM_VAD) Підвищити поріг активації голосової активності. (Rev.4.1)

Цей параметр буде дійсним, лише якщо він скомпільований з --enable-gmm-vad.

-gmmdown значення
(GMM_VAD) Нижній пороговий показник голосової активності. (Rev.4.1)

Цей параметр буде дійсним, лише якщо він скомпільований з --enable-gmm-vad.

Декодування варіант
Обробка в реальному часі означає одночасну обробку 1-го проходу обчислення MFCC
декодування. За замовчуванням обробка пропуску в режимі реального часу включена для мікрофона /
adinnet / netaudio input та для інших.

-реальний час , -без реального часу
Явно вмикайте / вимикайте обробку в реальному часі (конвеєрну) на першому проході.
За замовчуванням вимкнено для введення файлів і ввімкнено для мікрофона, adinnet і NetAudio
введення. Цей параметр стосується способу виконання CMN та нормалізації енергії:
якщо вимкнено, вони виконуватимуться з використанням середніх характеристик всього введення. Якщо ввімкнено, MAP-CMN
і нормалізація енергії для обробки в режимі реального часу.

Різний опції
-C jconffile
Завантажте файл jconf тут. При цьому вміст jconffile буде розширено
точка

-версія
Роздрукуйте інформацію про версію до стандартної помилки та вийдіть.

-налаштування
Роздрукуйте інформацію про налаштування двигуна до стандартної помилки та вийдіть.

-спокійно
Вивести менше журналу. Для результату буде надрукована лише найкраща послідовність слів.

-відлагоджувати
(Для налагодження) вивести величезне внутрішнє повідомлення та інформацію про налагодження в журнал.

- перевірити {wchmm|решітка|трифон}
Для налагодження увійдіть в режим інтерактивної перевірки.

-plugindir список каталогів
Вкажіть каталог для завантаження плагіна. Якщо існує кілька каталогів, вкажіть їх за
список, розділений двокрапкою.

Екземпляр декларація та цінності багато декодування
Наступні аргументи створять новий набір конфігурації з параметрами за замовчуванням, і
струм перемикання встановлений на нього. Параметри Jconf, вказані після параметра, будуть встановлені в
поточний набір.

Для виконання мультимодельного декодування ці аргументи слід вказати в першій частині кожної моделі
/ шукати екземпляри з різними назвами. Будь-які параметри перед першим визначенням
буде ігноровано.

Якщо визначення екземпляра не знайдено (як старіша версія Julius), всі параметри є
призначено екземпляру за замовчуванням під назвою _default.

Зауважте, що декодування з одним LM та кількома AM не повністю підтримується. Для
Наприклад, ви можете створити файл jconf таким чином.
Цей тип спільного використання моделі поки не підтримується, оскільки деяка частина обробки LM залежить
на призначеному АМ. Натомість ви можете отримати той самий результат, визначивши однакові LM для кожного
AM, ось так:

ім'я
Створіть новий набір конфігурації AM і переключіть поточний на новий. Ви повинні дати а
унікальна назва. (Rev.4.0)

-LM ім'я
Створіть новий набір конфігурації LM та переключіть поточний на новий. Ви повинні дати а
унікальна назва. (Rev.4.0)

-СР ім'я am_name lm_name
Створіть новий набір конфігурації пошуку та переключіть поточний на новий. Зазначений
AM і LM будуть призначені до нього. The am_name та lm_name може бути ім'ям або ідентифікатором
номер. Ви повинні дати унікальну назву. (Rev.4.0)

-AM_GMM
Використовуючи GMM для обробки інтерфейсу, ви можете вказати спеціальну акустику GMM
параметри після цього параметра. Якщо ви не вказуєте -AM_GMM з GMM, GMM буде
мають той самий вектор параметрів, що й останній AM. Поточна AM буде переключена на
GMM один, тому будьте обережні, щоб не переплутати зі звичайними конфігураціями AM. (Rev.4.0)

- ГЛОБАЛЬНИЙ
Почніть глобальний розділ. Глобальні параметри слід розміщувати перед будь-яким екземпляром
декларації або після цього параметра для розпізнавання кількох моделей. Цим можна скористатися
кілька разів. (Rev.4.1)

-перевірка носа , -перевірка розділу
Вимкнути/увімкнути перевірку розташування параметрів у декодуванні кількох моделей. Коли ввімкнено,
Параметри між оголошенням екземпляра розглядаються як "розділи" і лише належність
можна записати типи опцій. Наприклад, коли є варіант вказано, тільки AM
пов'язану опцію можна помістити після опції, поки не буде знайдено інше оголошення. також,
глобальні параметри слід розміщувати вгорі перед будь-яким оголошенням екземпляра. Це
увімкнено за замовчуванням. (Rev.4.1)

Language модель (-ЛМ)
Ця група містить варіанти визначення моделі кожного типу мовної моделі. При використанні
кілька LM, один екземпляр може мати тільки один LM.

Для конфігурації LM можна вказати лише один тип LM. Якщо ви хочете використовувати мульти
моделі, ви повинні визначити їх як нову LM.

N-грам
-d bingram_file
Використовуйте двійковий формат N-gram. N-грамний файл ARPA можна перетворити на двійковий файл Julius
формат за допомогою mkbingram.

-nlr arpa_ngram_file
Пряма, зліва направо модель мови N-gram у стандартному форматі ARPA. Коли
вказано як прямий N-грам, так і зворотний N-грам, Юліус використовує це
2-грам вперед для 1-го проходу і зворотний N-грам для 2-го проходу.

Оскільки файл ARPA часто стає величезним і вимагає багато часу для завантаження, це може бути
краще конвертувати файл ARPA у двійковий формат Julius за допомогою mkbingram. Зауважте, що
якщо для розпізнавання використовується як прямий, так і зворотний N-грам, вони разом будуть
бути перетворено в один двійковий файл.

Якщо за допомогою цієї опції вказано лише пряму N-граму, а не зворотну N-граму
визначено -nrl, Юлій виконує розпізнавання лише з прямою N-грамою. The
1-й прохід використовуватиме 2-грамовий запис у заданому N-грамі, а 2-й прохід – це
використовувати заданий N-грам з перетворенням прямих ймовірностей у зворотний
ймовірності за правилом Байеса. (Rev.4.0)

-nrl arpa_ngram_file
Зворотна, справа наліво мовна модель N-грам у стандартному форматі ARPA. Коли
вказано як прямий N-грам, так і зворотний N-грам, Юлій використовує прямий
2-грам для 1-го проходу, і цей зворотний N-грам для 2-го проходу.

Оскільки файл ARPA часто стає величезним і вимагає багато часу для завантаження, це може бути
краще конвертувати файл ARPA у двійковий формат Julius за допомогою mkbingram. Зауважте, що
якщо для розпізнавання використовується як прямий, так і зворотний N-грам, вони разом будуть
бути перетворено в один двійковий файл.

Якщо цією опцією вказано лише зворотний N-грам, а не прямий N-грам
визначено -nlr, Юлій виконує розпізнавання лише з зворотним N-грамом.
При 1-му проходженні буде використана пряма 2-грамова ймовірність, обчислена з зворотного боку
2 грами за правилом Байєса. 2-й прохід повністю використовує даний зворотний N-грам.
(Rev.4.0)

-v dict_file
Файл словника Word.

-силоголовка рядок_слова -силхвіст рядок_слова
Слово мовчання, визначене в словнику, для мовчання на початку
речення і кінець речення. (за замовчуванням: " ", " ")

- мапанк рядок_слова
Вкажіть невідоме слово. За замовчуванням " "або" ". Це буде використано для призначення
ймовірність слів на невідомих словах, тобто слів у словнику, яких немає в
N-грамова лексика.

-iwspword
Додайте до словника слово, яке має відповідати паузам між словами.
Це може підвищити точність розпізнавання в деякій мовній моделі, яка не має
явне моделювання паузи між словами. Запис слова, який потрібно додати, можна змінити за допомогою
-iwscontry.

-iwscontry рядок_введення_слова
Вкажіть слово, яке буде додано -iwspword. (за замовчуванням: " [sp] зр
sp")

-сепнум номер
Кількість високочастотних слів, які потрібно виділити з дерева лексики, щоб полегшити
помилка апроксимації, яка може бути викликана одним найкращим наближенням 1-го
пройти. (за замовчуванням: 150)

Граматика
Декілька граматик можна вказати, повторюючи -грам та - Грамлист. Зауважте, що це
є незвичайною поведінкою інших варіантів (у звичайному варіанті Julius останній буде
замінити попередні). Ви можете використовувати -нограма щоб скинути граматику вже
зазначено перед пунктом.

-грам gramprefix1[,gramprefix2[,gramprefix3,...]]
Список граматик, розділених комами. аргумент має бути префіксом
граматику, тобто якщо у вас є foo.dfa та foo.dict, ви повинні вказати їх за допомогою a
єдиний аргумент foo. Декілька граматик можна вказати одночасно як a
список, розділений комами.

- Грамлист файл_списку
Вкажіть файл зі списком граматики, який містить список граматик, які потрібно використовувати. Список
файл повинен містити префікси граматик, кожен на рядок. Відносний шлях в
файл списку буде розглядатися як відносно файлу, а не поточний шлях або
файлу конфігурації.

-dfa dfa_file -v dict_file
Старий спосіб окремого визначення граматичних файлів. Це підробка, і не повинно
використовуватися більше.

-нограма
Видалити поточний список граматик, який уже зазначено в -грам, - Грамлист, -dfa
та -v.

Ізольований слово
Словник можна вказати за допомогою -w та -wlist. Коли ви вказуєте декілька
разів, усі вони будуть прочитані під час запуску. Ви можете використовувати -нограма скинути
вже вказані словники на той момент.

-w dict_file
Словник слів для розпізнавання ізольованих слів. Формат файлу такий самий, як і інший
LM. (Rev.4.0)

-wlist файл_списку
Вкажіть файл списку словників, який містить список словників, які будуть використовуватися.
Файл списку повинен містити назву файлу словників, кожен на рядок. А
відносний шлях у файлі списку буде розглядатися як відносний до файлу списку, а не
поточний шлях або файл конфігурації. (Rev.4.0)

-нограма
Видалити поточний список словників, які вже вказані -w та -wlist.

-wsil head_sil_model_name tail_sil_model_name sil_context_name
При розпізнаванні ізольованих слів моделі мовчання будуть додані до голови та
хвіст кожного слова при впізнаванні. Цей параметр визначає, які моделі безшумності мають бути
додається. sil_context_name це назва моделі головного і хвоста
як контекст слів head phone і tail phone. Наприклад, якщо вказати
-wsil silB silE sp, слово з телефонною послідовністю b eh t буде перекладено як silB
sp-b+eh b-eh+t eh-t+sp silE. (Rev.4.0)

Визначений користувачем LM
-userlm
Оголосити про використання функцій LM користувача в програмі. Цей параметр слід вказати
якщо ви використовуєте визначені користувачем функції LM. (Rev.4.0)

Різний LM опції
-примусово
Пропустіть слова з помилками в словнику та примусово запустіть.

Акустичний модель та особливість аналіз (-AM) (-AM_GMM)
У цьому розділі йдеться про параметри акустичної моделі, вилучення ознак, функції
нормалізації та спектрального віднімання.

Після назви -AM слід написати акустичну модель та відповідну специфікацію. Ви можете використовувати
кілька AM, навчені з різними типами MFCC. Для GMM необхідна умова параметра
слід вказати так само, як і після -AM_GMM.

При використанні кількох АМ значення -smpPeriod, -smpFreq, -fsize та -зміна повинно бути
однаково серед усіх АМ.

Акустичний HMM
-h hmmdef_файл
Файл визначення акустичного HMM. Він має бути у форматі HTK ascii або у двійковому файлі Julius
формат. Ви можете конвертувати формат HTK ascii у двійковий формат Julius за допомогою mkbinhmm.

-hlist hmmlist_file
Файл HMMLlist для відображення телефону. Цей файл забезпечує зіставлення між логічними
імена трифонів, згенеровані в словнику, і визначені імена HMM в hmmdefs.
Цей параметр слід вказати для контекстно-залежної моделі.

-tmix номер
Вкажіть кількість верхніх гауссів, які потрібно обчислити в кодовій книзі суміші.
Невелике число прискорить акустичні обчислення, але точність AM може підвищитися
гірше із занадто малим значенням. Дивись також -gprune. (за замовчуванням: 2)

-спмодель ім'я
Укажіть назву моделі HMM, яка відповідає короткій паузі у висловлюванні. The
Коротка пауза назва моделі буде використовуватися для розпізнавання: коротка пауза пропуск увімкнено
розпізнавання граматики, вставка моделі короткої паузи в кінці слова с -iwsp на N-грам,
або сегментація з короткою паузою (-segment). (за замовчуванням: "sp")

- багатопроменева
Увімкнути багатопрохідний режим. Щоб зробити декодування швидшим, Julius за замовчуванням накладає a
обмеження на переходи HMM, що кожна модель повинна мати лише один перехід
початковий стан і кінцевий стан. У багатошляховому режимі Julius виконує додаткову обробку
на міжмодельному переході до дозволяє перехід з пропуском моделі та кілька
вихідні/вхідні переходи. Зауважте, що вказівка ​​цієї опції зробить Julius a
трохи повільніше, і може знадобитися більша ширина променя.

Ця функція була опцією під час компіляції в Julius 3.x, а тепер стає a
варіант часу виконання. За замовчуванням (без цієї опції) Julius перевіряє перехід
тип вказаних HMM та увімкніть багатошляховий режим, якщо потрібно. Ти можеш
примусово ввімкнути багатопрохідний режим за допомогою цієї опції. (версія 4.0)

-gprune {безпечний|евристичний|промінь|немає|за замовчуванням}
Встановіть для використання алгоритм обрізання Гаусса. Для моделі пов’язаної суміші виступає Юліус
Гауссове обрізання для зменшення акустичних обчислень шляхом обчислення лише верхнього N
Гауссів у кожній кодовій книзі в кожному кадрі. Буде встановлено налаштування за замовчуванням
відповідно до типу моделі та налаштувань двигуна. за замовчуванням буде примусово прийняти
налаштування за замовчуванням. Встановіть значення «Немає», щоб вимкнути обрізання та виконати повне виконання
обчислення. безпечний гарантує обчислення вершин N Гаусса. евристичний і
промінь робить більш агресивне скорочення обчислювальних витрат, але може призвести до невеликого
втрата моделі точності (за замовчуванням: безпечна (стандартна), балка (швидка) для зв’язаної суміші
модель, немає для моделі без зв’язаної суміші).

-iwcd1 {макс|сер.|найкраще число}
Виберіть метод для наближення міжслівного трифона на голові та хвості слова
у першому проході.

max застосовуватиме максимальну ймовірність того ж контексту трифони. середня буде
застосувати середню ймовірність того ж контексту трифони. найкраще число буде
застосувати середнє значення N-найкращих ймовірностей того самого контекстного трифона.

За замовчуванням найкраще 3 для використання з N-грамами, і середнє значення для граматики та слова. Коли це
AM є спільною для LM обох типів, буде обрано останній.

-iwspштраф плавати
Штраф за вставку за короткі паузи в кінці слова, додані -iwsp.

-гшмм hmmdef_файл
Якщо вказано цю опцію, Julius виконує вибір суміші за Гауссом
ефективне декодування. hmmdefs має бути монофонною моделлю, створеною з файлу
звичайний монофон моделі HMM, використовуючи mkgshmm.

-gsnum номер
На GMS вкажіть кількість станів монофону для обчислення відповідних трифонів
деталь. (за замовчуванням: 24)

Мова аналіз
У поточному Julius підтримується лише вилучення функцій MFCC. Таким чином при впізнаванні
Форма сигналу, введена з файлу або мікрофона, AM повинна бути навчена MFCC. Параметр
умова також має бути точно такою ж, як і умова навчання
варіанти нижче.

Коли ви вводите дані у файлі параметрів HTK, ви можете використовувати будь-який тип параметра для
AM. У цьому випадку Юліуса не хвилює тип вхідної функції і AM, просто
прочитати їх як векторну послідовність і зіставити їх із заданою AM. Юлій тільки перевіряє
чи однакові типи параметрів. Якщо він не працює добре, ви можете відключити
це перевірка -notypecheck.

У Julius параметр тип і кваліфікатори (як TARGETKIND в HTK) і число
кепстральних параметрів (NUMCEPS) буде встановлено автоматично із вмісту
AM заголовок, тому вам не потрібно вказувати їх параметрами.

Інші параметри повинні бути встановлені точно так само, як і умови навчання. Ви також можете
надайте файл конфігурації HTK, який ви використовували для навчання AM для Julius -htkconf. Коли це
застосовано параметр, Julius розбере конфігураційний файл і встановить відповідний параметр.

Ви можете додатково вставити ці параметри аналізу в двійковий файл HMM за допомогою
mkbinhmm.

Якщо параметри вказані кількома способами, вони будуть оцінені в наведеному нижче порядку.
Вбудований параметр AM буде завантажено першим, якщо він є. Потім конфігураційний файл HTK
дається -htkconf буде розібрано. Якщо значення вже встановлено за допомогою вбудованого значення AM, HTK
config замінить їх. Нарешті будуть завантажені прямі параметри, які будуть
замінити налаштування, завантажені раніше. Зауважте, що, коли вказані ті самі параметри
кілька разів пізніше замінить попередній, за винятком цього -htkconf буде оцінено
спочатку, як описано вище.

-smpPeriod period
Період вибірки вхідного мовлення в одиниці 100 наносекунд. Частота вибірки може
також бути вказано за -smpFreq. Зверніть увагу, що вхідна частота повинна бути
встановлюється рівним умовам навчання АМ. (за замовчуванням: 625, відповідає
16,000 Гц)

Цей параметр відповідає параметру HTK SOURCERATE. Таке ж значення може бути
надано цьому варіанту.

При використанні кількох АМ це значення має бути однаковим для всіх АМ.

-smpFreq Hz
Встановити частоту дискретизації вхідної мови в Гц. Частота вибірки також може бути
вказано за допомогою -smpPeriod. Зверніть увагу, що ця частота повинна бути рівною
до умов навчання АМ. (за замовчуванням: 16,000 XNUMX)

При використанні кількох АМ це значення має бути однаковим для всіх АМ.

-fsize номер_зразка
Розмір вікна в кількості зразків. (за замовчуванням: 400)

Цей параметр відповідає параметру HTK WINDOWSIZE, але значення має бути в
зразки (значення HTK / smpPeriod).

При використанні кількох АМ це значення має бути однаковим для всіх АМ.

-зміна номер_зразка
Зсув кадру в кількості зразків. (за замовчуванням: 160)

Цей параметр відповідає параметру HTK TARGETRATE, але значення має бути в
зразки (значення HTK / smpPeriod).

При використанні кількох АМ це значення має бути однаковим для всіх АМ.

-випереджувати плавати
Коефіцієнт попереднього акценту. (за замовчуванням: 0.97)

Ця опція відповідає параметру HTK PREEMCOEF. Таке ж значення можна дати
до цього варіанту.

-fbank Num
Кількість каналів банку фільтрів. (за замовчуванням: 24)

Ця опція відповідає параметру HTK NUMCHANS. Таке ж значення можна дати
до цього варіанту. Майте на увазі, що значення за замовчуванням не таке, як у HTK (22).

-цепліф Num
Цепстральний коефіцієнт підйому. (за замовчуванням: 22)

Ця опція відповідає параметру HTK CEPLIFTER. Таке ж значення можна дати
до цього варіанту.

-сире , -norawe
Увімкнути/вимкнути використання сирої енергії перед попереднім наголосом (за замовчуванням: вимкнено)

Ця опція відповідає параметру HTK RAWENERGY. Майте на увазі, що за замовчуванням
значення відрізняється від HTK (увімкнено на HTK, вимкнено в Julius).

- нормально , -ненормальний
Увімкнути/вимкнути нормалізацію енергії журналу. При живому введенні ця нормалізація буде
наближено від середнього останнього введення. (за замовчуванням: вимкнено)

Цей параметр відповідає параметру HTK ENORMALISE. Майте на увазі, що за замовчуванням
значення відрізняється від HTK (увімкнено на HTK, вимкнено в Julius).

- escale float_scale
Коефіцієнт масштабування логарифмічної енергії при нормалізації логарифмічної енергії. (за замовчуванням: 1.0)

Ця опція відповідає опції HTK ESCALE. Майте на увазі, що за замовчуванням
значення відрізняється від HTK (0.1).

- silfloor плавати
Енергетичний рівень тиші в дБ при нормалізації логарифмічної енергії. (за замовчуванням: 50.0)

Ця опція відповідає опції HTK SILFLOOR.

-Дельвін кадр
Розмір вікна Delta в кількості кадрів. (за замовчуванням: 2)

Цей параметр відповідає параметру HTK DELTAWINDOW. Таке ж значення може бути
надано цьому варіанту.

-accwin кадр
Розмір вікна прискорення в кількості кадрів. (за замовчуванням: 2)

Цей параметр відповідає параметру HTK ACCWINDOW. Таке ж значення можна дати
до цього варіанту.

-висока частота Hz
Увімкнути обмеження смуги для обчислення банку фільтрів MFCC: встановити верхню частоту
відрізати. Значення -1 вимкне його. (за замовчуванням: -1)

Ця опція відповідає параметру HTK HIFREQ. Таке ж значення можна надати
цей варіант.

-lofreq Hz
Увімкнути обмеження діапазону для обчислення банку фільтрів MFCC: встановити нижчу частоту
відрізати. Значення -1 вимкне його. (за замовчуванням: -1)

Цей параметр відповідає параметру HTK Option LOFREQ. Таке ж значення можна надати
цей варіант.

-zmeanframe , -nozmeanframe
З мовним введенням ця опція вмикає/виключає видалення зсуву постійного струму за кадром.
Це відповідає конфігурації HTK ZMEANSOURCE. Це не можна використовувати разом
з -мати на увазі. (за замовчуванням: вимкнено)

-потужність використання
Використовуйте потужність замість величини для аналізу банку фільтрів. (за замовчуванням: вимкнено)

Нормалізація
Julius може виконувати нормалізацію середнього кепстра (CMN) для вхідних даних. CMN буде
активовано, коли даний AM був навчений за допомогою CMN (тобто має кваліфікатор "_Z" у
заголовок).

Середнє кепстра буде оцінюватися по-різному відповідно до типу введення.
При введенні файлу середнє значення буде обчислено з усього введення. На живий вхід такий
як мікрофонний і мережевий вхід, середнє значення входу невідоме
почати. Тому буде використовуватися MAP-CMN. На MAP-CMN буде застосований початковий середній вектор
на початку, а середній вектор буде змащений до середнього значення
збільшення вхідного вектора в міру введення. Наведені нижче параметри можуть керувати поведінкою
КАРТА-CMN.

-cvn
Увімкнути нормалізацію кепстральної дисперсії. При введенні файлу дисперсія цілого
вхідні дані будуть обчислені, а потім застосовані. При живому мікрофонному вході, дисперсія
буде застосовано останній вхід. CVN підтримується лише для аудіовходу.

-vtln альфа низький кут порізати
Виконуйте деформацію частоти, як правило, для нормалізації довжини голосового тракту (VTLN).
Аргументами є коефіцієнт деформації, відсічення високої частоти та низька частота. відрізати. Вони
відповідають значенням HTK Config, WARPFREQ, WARPHCUTOFF та WARPLCUTOFF.

-cmnload файл
Завантажте початковий вектор середнього кепстра з файлу під час запуску. The файл має бути одним
збережено -cmnsave. Завантаження початкового кепстрального середнього дозволяє Юлію краще працювати
розпізнати перше висловлювання на введеному в реальному часі. При спільному застосуванні з
-cmnnoupdate, це початкове значення буде використовуватися для всіх введених даних.

-cmnsave файл
Збережіть обчислений вектор середнього кепстра в файл. Параметри будуть збережені
на кожному вхідному кінці. Якщо вихідний файл уже існує, він буде замінено.

-cmnupdate -cmnnoupdate
Контролюйте, чи потрібно оновлювати середнє кепстральне значення на кожному вході на вводі в реальному часі.
Вимкнути це та вказати -cmnload змусить двигун завжди використовувати завантажений
статичне початкове кепстральне середнє.

-cmnmapweight плавати
Вкажіть вагу початкового середнього кепстра для MAP-CMN. Вкажіть більше значення до
зберігати початкове кепстральне середнє протягом більш тривалого періоду та створювати менше значення
кепстральне середнє більше покладається на поточний вхід. (за замовчуванням: 100.0)

Front-end обробка
Юлій може виконувати спектральне віднімання, щоб зменшити деякий стаціонарний шум від звуку
введення. Хоча це не потужний метод, але він може спрацювати в певній ситуації.
Юліус має два способи оцінити спектр шуму. Один із способів – припустити, що перший
короткий сегмент мовного входу є сегментом шуму, і оцінюють спектр шуму
як середнє значення відрізка. Інший спосіб — обчислити середній спектр із
введіть лише шум, використовуючи інший інструмент mkss, і завантажте його в Julius. Колишній є
популярний для введення мовних файлів, а останній слід використовувати для введення в реальному часі. Варіанти
нижче перемикає/керує поведінкою.

-sscalc
Виконайте спектральне віднімання, використовуючи головну частину кожного файлу як частину мовчання. The
Довжина частини голови має бути визначена -sscalclen. Діє лише для введення файлів.
Конфлікт з -ssload.

-sscalclen мсек
з -sscalc, вкажіть тривалість тиші голови для оцінки спектру шуму
в мілісекундах. (за замовчуванням: 300)

-ssload файл
Виконайте спектральне віднімання для мовного введення, використовуючи попередньо оцінений спектр шуму
завантажено з файл. Файл спектру шуму можна створити за допомогою mkss. Діє для всіх
мовлення. Конфлікт з -sscalc.

-ссальфа плавати
Альфа-коефіцієнт спектрального віднімання для -sscalc та -ssload. Шум буде
віднімається сильніше, оскільки це значення стає більше, але спотворення результату
сигнал також стає чудовим. (за замовчуванням: 2.0)

-ssfloor плавати
Підлоговий коефіцієнт спектрального віднімання. Спектральна потужність, яка йде нижче
нуль після віднімання буде замінений вихідним сигналом на цей
коефіцієнт помножений. (за замовчуванням: 0.5)

Різний AM опції
-htkconf файл
Проаналізуйте наданий файл конфігурації HTK і встановіть відповідні параметри Julius.
При використанні цієї опції значення параметрів за замовчуванням змінюються з Julius
за замовчуванням HTK.

Визнання процес та пошук (-СР)
Цей розділ містить параметри пошуку на 1-му / 2-му проході, наприклад промінь
ширина та ваги LM, конфігурації для сегментації короткої паузи, перемикачі для слова
решітчастий вихід і сплутаний мережевий вихід, примусове вирівнювання та інші параметри, що стосуються
процес розпізнавання та вихід результату.

Значення за замовчуванням для ширини променя та ваги LM зміняться відповідно до налаштування часу компіляції
JuliusLib , типу моделі AM та розміру LM. Будь ласка, перегляньте журнал запуску для фактичного
значень.

1st проходити параметри
-lmp вага штраф
(N-грам) Вагові показники мовної моделі та штрафи за вставку слів для першого проходу.

-штраф 1 штраф
(Граматика) Штраф за вставку слів за перший прохід. (за замовчуванням: 0.0)

-b ширина
Ширина променя у кількості вузлів HMM для рангового опромінення на першому проході. Це значення
визначає ширину пошуку на 1-му проході та має домінуючий вплив на загальний результат
Час обробки. Менша ширина пришвидшить декодування, але занадто мале значення
призведе до значного збільшення помилок розпізнавання через пошук
невдача. Більше значення зробить пошук стабільним і приведе до безвідмовності
пошуку, але час обробки буде зростати пропорційно ширині.

Значення за замовчуванням залежить від типу акустичної моделі: 400 (монофон), 800
(трифон) або 1000 (трифон, налаштування=v2.1)

-nліміт Num
Верхня межа маркера на вузол. Цей параметр дійсний, коли --enable-wpair і
--enable-wpair-nlimit увімкнено під час компіляції.

-прогоут
Увімкнути прогресивне виведення часткових результатів під час першого проходу.

-прогінальний інтервал мсек
Встановіть часовий інтервал для -прогоут в мілісекундах. (за замовчуванням: 300)

2nd проходити параметри
-lmp2 вага штраф
(N-грам) Вагові показники мовної моделі та покарання за вставлення слів для другого
прохід.

-штраф 2 штраф
(Граматика) Штраф за вставку слів за другий прохід. (за замовчуванням: 0.0)

-б2 ширина
Ширина променя огинаючої (кількість гіпотези) при другому проході. Якщо кількість
розширення слів за певної довжини гіпотези досягає цієї межі під час пошуку,
коротші гіпотези не розширюються далі. Це перешкоджає пошуку
широта, як ситуація укладання на тій же позиції, і покращити пошук
невдача переважно через великий словниковий запас. (за замовчуванням: 30)

-sb плавати
Ширина конверта для оцінки в конверті. При обчисленні балів гіпотези
для кожної згенерованої гіпотези, її розширення решітки та операція Вітербі буде
обрізати в середині промови, якщо оцінка на рамці йде за ширину.
Надання невеликого значення робить другий прохід швидше, але може помилка обчислення
відбуваються. (за замовчуванням: 80.0)

-s Num
Розмір стека, тобто максимальна кількість гіпотез, яка може бути збережена на
стек під час пошуку. Більше значення може дати більш стабільні результати, але
збільшує необхідний обсяг пам'яті. (за замовчуванням: 500)

-m вважати
Кількість розширених гіпотез, необхідних для припинення пошуку. Якщо число
розгорнутих гіпотез більше, ніж цей поріг, тоді пошук є
на той момент припинено. Чим більше це значення, тим довше Юлій досягає
відмовитися від пошуку. (за замовчуванням: 2000)

-n Num
Кількість кандидатів, які Юліус намагається знайти. Пошуки тривають до цього часу
знайдено кількість гіпотез речень. Отримані гіпотези речення
сортуються за балами, а кінцевий результат відображається в порядку (див
-вихід). Можливість того, що оптимальна гіпотеза знайдена правильно
збільшується зі збільшенням цього значення, але час обробки також збільшується
довше. Значення за замовчуванням залежить від налаштування двигуна під час компіляції: 10
(стандартний) або 1 (швидкий або v2.1)

-вихід Num
Гіпотеза N верхнього речення, яка буде виведена в кінці пошуку. Використовуйте з -n
(за замовчуванням: 1)

- діапазон пошуку кадр
Встановіть кількість кадрів до і після, щоб шукати гіпотези наступного слова в
решітка слова на другому проході. Це запобігає пропуску коротких слів, але
при великому значенні кількість розгорнутих гіпотез збільшується і система
стає повільним. (за замовчуванням: 5)

- looktrellis
(Граматика) Розгорніть лише слова, що збереглися після першого проходу, замість того, щоб розгорнути
всі слова, передбачені граматикою. Ця опція виконує декодування другого проходу
швидше, особливо для великого словникового запасу, але може збільшити видалення
помилка коротких слів. (за замовчуванням: вимкнено)

Коротка пауза сегментація / декодер-VAD
При компіляції з --enable-decoder-vad сегментація короткої паузи буде
розширено для підтримки VAD на основі декодера.

-segment
Увімкнути режим сегментації короткої паузи. Введення буде сегментовано після короткої паузи
word (слово з моделлю мовчання у вимові) отримує найвищу ймовірність
у певних послідовних кадрах на першому проході. При виявленні кінця сегмента,
Юлій зупиняє 1-й перехід у точці, виконує 2-й перехід і продовжує наступним
сегмент. Контекст слова буде розглядатися серед сегментів. (Rev.4.0)

Під час компіляції з --enable-decoder-vad цей параметр вмикає VAD на основі декодера,
щоб пропустити довге мовчання.

-спдур кадр
Тривалість короткої паузи для визначення кінця вхідного сегмента в кількості кадрів.
(за замовчуванням: 10)

-моделі паузи рядок
Відокремлений комами список назв моделей паузи, які будуть використовуватися під час короткої паузи
сегментація. Слово, вимова якого складається лише з моделей паузи
буде розглядатися як "слово паузи" і використовуватися для визначення паузи. Якщо не вказано,
ім'я -спмодель, -силоголовка та -силхвіст буде використано. (Rev.4.0)

-spmargin кадр
Запас кроку назад при активації для VAD на основі декодера. Коли мова вгору-тригер
знайдений декодером-VAD, Julius перемотає вхідний параметр на це значення, і
почати розпізнавання в точці. (Rev.4.0)

Цей параметр буде дійсним, лише якщо він скомпільований з --enable-decoder-vad.

-spdelay кадр
Кадр затримки рішення тригера під час запуску для VAD на основі декодера. (Rev.4.0)

Цей параметр буде дійсним, лише якщо він скомпільований з --enable-decoder-vad.

слово решітка / замішання мережу вихід
- решітка , -нерешітка
Увімкнути/вимкнути створення діаграми слів. Алгоритм пошуку також змінився на
оптимізувати для кращого генерування діаграми слів, тому результат пропозиції може бути не той
те саме, що і звичайне N-краще розпізнавання. (Rev.4.0)

-confnet , -noconfnet
Увімкнути/вимкнути генерацію мережі плутанини. Увімкнення цього також дозволить
активує - решітка внутрішньо. (Rev.4.0)

-графічний діапазон кадр
Об’єднати ті самі слова в сусідній позиції при генерації графіка. Якщо час початку
і час закінчення двох слів-кандидатів одного слова знаходиться в межах зазначеного
діапазон, вони будуть об’єднані. За замовчуванням 0 (дозволити об’єднання тих самих слів на
точно в тому самому місці) і вказати більше значення призведе до меншого
вихід графіка. Якщо встановити це значення на -1, об’єднання буде вимкнено, у цьому випадку те саме
слова на тому самому місці з різними оцінками залишаться такими, якими вони є.
(за замовчуванням: 0)

-графічний виріз глибина
Виріжте отриманий графік за глибиною слова на етапі постобробки. Глибина
Значення — це кількість слів, які можуть бути дозволені в кадрі. Установка на -1 вимикає
ця функція. (за замовчуванням: 80)

-граф зв'язаний цикл вважати
Обмежте кількість контурів регулювання меж на етапі постобробки. Це
Параметр запобігає блокування Юліуса нескінченним циклом регулювання коротким
коливання слова. (за замовчуванням: 20)

-затримка пошуку графіка , -nographsearchdelay
Коли цей параметр увімкнено, Julius вмикає свій алгоритм генерації графіка
2-й прохід, щоб не завершувати пошук шляхом злиття графів, до першого речення
кандидат знайдений. Цей параметр може покращити точність графіка, особливо якщо ви
збираються створити величезний графік слів, налаштувавши широкий пошук. А саме, може
покращує точність графіка, коли ви встановлюєте широкі промені на обох 1-х проходах -b та
2-й прохід -б2, і велика кількість для -n. (за замовчуванням: вимкнено)

Мультиграм / багато-діч визнання
-мультиграм , -номультиграм
Під час розпізнавання граматики з використанням кількох граматик Julius виведе лише найкраще
результат серед усіх граматик. Увімкнення цієї опції змусить Julius вивести
результат для кожної граматики. (за замовчуванням: вимкнено)

Примусовий вирівнювання
- вирівняти
Виконайте вирівнювання вітербі за одиницями слова для результату розпізнавання. Слово
будуть розраховані граничні кадри та середні акустичні бали за кадр.

- паліг
Щоб отримати результат розпізнавання, виконайте вирівнювання по телефонних одиницях. Телефон
будуть розраховані граничні кадри та середні акустичні бали за кадр.

-вирівняти
Виконайте вирівнювання вітербі за станом для результату розпізнавання. Державний кордон
кадрів і будуть розраховані середні акустичні бали за кадр.

Різний пошук опції
-неактивний
Запустіть цей екземпляр процесу розпізнавання з неактивного стану. (Rev.4.0)

-1 прохід
Виконайте тільки перший прохід.

-резервний 1 прохід
Коли 2-й прохід не вдається, Юліус закінчує розпізнавання без результату. Цей варіант
скажіть Юлію вивести результат 1-го проходу як кінцевий результат під час 2-го проходу
не вдається. Зауважте, що деякі результати (впевненість тощо) можуть бути некорисними. Це було
типова поведінка Julius-3.x.

-no_ccd , -force_ccd
Явно перемикайте обробку контексту телефону під час пошуку. Зазвичай Юлій визначає
чи є використання AM залежною від контексту моделлю чи ні з назв моделей,
тобто, чи містять імена символи + і -. Ця опція замінить
автоматичне виявлення.

-cmalpha плавати
Параметр згладжування для оцінки впевненості. (за замовчуванням: 0.05)

-iwsp
(Тільки в багатошляховому режимі) Увімкнути вставку короткої паузи між словами.
Цей параметр додає модель короткої паузи, яку можна пропустити, для кожного кінця слова. The
Модель короткої паузи може бути визначена за допомогою -спмодель.

- трансп плавати
Додатковий штраф за вставку для прозорих слів. (за замовчуванням: 0.0)

- демо
Дорівнює -прогоут -спокійно.

НАВКОЛИШНЄ СЕРЕДОВИЩЕ ЗМІННІ


АЛЬСАДЕВ
(за допомогою мікрофонного входу з пристроєм alsa) вкажіть назву пристрою захоплення. Якщо не вказано,
буде використано "за замовчуванням".

АУДІОДЄВ
(за допомогою мікрофонного входу з пристроєм oss) вкажіть шлях пристрою захоплення. Якщо не вказано,
"/dev/dsp" буде використано.

LATENCY_MSEC
Спробуйте встановити затримку введення мікрофона в мілісекундах. Менше значення буде
скорочують затримку, але іноді роблять процес нестабільним. Значення за замовчуванням буде залежати від
працює ОС.

ПРИКЛАДИ


Для прикладів використання системи зверніться до розділу підручника в документах Julius.

УВАГА!


Примітка щодо файлів jconf: відносні шляхи у файлі jconf інтерпретуються як відносні до
jconf, а не в поточний каталог.

Використовуйте julius онлайн за допомогою служб onworks.net


Безкоштовні сервери та робочі станції

Завантажте програми для Windows і Linux

  • 1
    Завантажувач зображень
    Завантажувач зображень
    Сканувати та завантажувати зображення за допомогою
    Selenium Використання python3 і PyQt5.
    Підтримувана пошукова система: Google, Bing,
    Baidu. Введення ключових слів з клавіатури
    або введення з ...
    Завантажити Image Downloader
  • 2
    Плагін Eclipse Tomcat
    Плагін Eclipse Tomcat
    Надає плагін Eclipse Tomcat
    проста інтеграція сервлета tomcat
    контейнер для розробки java
    веб-додатків. Ви можете приєднатися до нас для
    обговорення...
    Завантажте плагін Eclipse Tomcat
  • 3
    WebTorrent робочий стіл
    WebTorrent робочий стіл
    WebTorrent Desktop призначений для потокової передачі
    торренти на Mac, Windows або Linux. Це
    підключається до BitTorrent і
    Однолітки WebTorrent. Тепер немає
    треба чекати...
    Завантажити WebTorrent Desktop
  • 4
    GenX
    GenX
    GenX – це наукова програма для вдосконалення
    відбиваюча здатність рентгенівських променів, нейтрон
    відбивна здатність і поверхневий рентген
    дифракційні дані за допомогою диференціала
    еволюційний алгоритм...
    Завантажте GenX
  • 5
    pspp4windows
    pspp4windows
    PSPP — програма для статистики
    аналіз вибіркових даних. Це безкоштовно
    заміна на пропрієтарну програму
    SPSS. PSPP має як текстові, так і
    графічний нас...
    Завантажте pspp4windows
  • 6
    Розширення Git
    Розширення Git
    Git Extensions — це окремий інструмент інтерфейсу користувача
    для керування сховищами Git. Це також
    інтегрується з Провідником Windows і
    Microsoft Visual Studio
    (2015/2017/2019). Ч...
    Завантажте розширення Git
  • Детальніше »

Команди Linux

Ad