Це команда mkbingram, яку можна запустити в безкоштовному хостинг-провайдері OnWorks за допомогою однієї з наших безкоштовних онлайн-робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS
ПРОГРАМА:
ІМ'Я
mkbingram
- створити двійкову N-граму з файлу N-грами ARPA
СИНТАКСИС
mkbingram [-nlr forward_ngram.arpa] [-nrl backward_ngram.arpa] [-д old_bingram_file]
{output_bingram_file}
ОПИС
mkbingram це інструмент для перетворення файлів визначення N-грамів у стандартному форматі ARPA у a
компактний бінарний формат Julius. Це значно прискорить початковий час завантаження N-грам
швидше. Він може безпосередньо читати файл gzip.
Починаючи з версії 4.0, Julius може мати справу з прямою N-грамою, зворотною N-грамою та їх комбінаціями.
Отже, mkbingram тепер генерує двійковий файл N-gram з одного з них або об’єднує їх два
створити одну двійкову N-грамму.
Якщо вказано лише прямий N-грам, mkbingram генерує двійкову N-граму лише з
вперед N-грам. При використанні цієї двійкової N-грами в Julius, вона виконує 1-й прохід з
2-грамові ймовірності в N-грамі, і запустіть 2-й прохід із заданою N-грамою повністю, з
перетворення прямих ймовірностей у зворотні за правилом Байєса.
Якщо вказано лише зворотну N-грамму, mkbingram генерує двійковий файл N-gram, який
містить лише зворотну N-граму. Під час 1-го проходу використовуватимуться 2-грамові ймовірності вперед
можна обчислити із зворотного 2-граму за правилом Байєса, а 2-й прохід використовувати наведене
назад N-грам повністю.
Якщо вказано обидва N-грами, прямий і зворотний, 2-грамова частина в прямому
N-gram і всі зворотні N-gram будуть об’єднані в один файл bingram. Форвард
2-грамовий буде застосовано для 1-го проходу та зворотний N-грам для 2-го проходу. Зауважте, що
обидві N-грами повинні бути навчені в тому самому корпусі з однаковими параметрами (тобто межа
пороги), з однаковою лексикою.
Стара двійкова N-грама, створена mkbingram версії 3.x і раніших можна використовувати в
Julius-4, але ви можете конвертувати стару версію в нову, вказавши її як вхідні дані
струму mkbingram за варіантом "-d".
Будь ласка, зверніть увагу, що двійковий N-грам файл конвертовано mkbingram версії 4.0 і пізніших не може
бути прочитаним старшим Юлієм 3.x.
ВАРІАНТИ
-nlr forward_ngram.arpa
Читання у форматі N-gram у прямому (зліва направо) слові в стандартному форматі ARPA.
-nrl backward_ngram.arpa
Читайте у зворотному (справа наліво) словесному файлі N-gram у стандартному форматі ARPA.
-d old_bingram_file
Прочитати у двійковому файлі N-gram.
-обмін
Поміняйте місцями слово BOS і слово EOS у N-грам.
вихідний_bingram_файл
ім'я двійкового файлу N-gram для виведення.
ПРИКЛАДИ
Перетворіть набір прямого та зворотного N-грам у форматі ARPA у двійкову форму Юліуса:
Перетворіть один форвардний 4-грамовий формат ARPA у двійковий файл:
Перетворіть старий двійковий файл N-gram у поточний формат:
Використовуйте mkbingram онлайн за допомогою сервісів onworks.net