англійськафранцузькаіспанська

Ad


Значок OnWorks

mmorph - Інтернет у хмарі

Запустіть mmorph у безкоштовному хостинг-провайдері OnWorks через Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

Це команда mmorph, яку можна запустити в безкоштовному хостинг-провайдері OnWorks за допомогою однієї з наших безкоштовних онлайн-робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

ПРОГРАМА:

ІМ'Я


mmorph - інструмент морфології MULTEXT

СИНТАКСИС


інформація:
mmorph [ -вх ]

лише аналізувати:
mmorph -y | -z [ -a addfile ]
-m morphfile [ -d debug_map ] [ -l файл журналу ] [ infile [ вихідний файл ]]

генерувати:
mmorph -c | -n [ -t trace_level ] [ -s trace_level ] [ -a addfile ]
-m morphfile [ -d debug_map ] [ -l файл журналу ] [ infile [ вихідний файл ]]

простий пошук:
mmorph [ -фі ] [ -b | -k ] [ -r Rejectfile ]
-m morphfile [ -d debug_map ] [ -l файл журналу ] [ infile [ вихідний файл ]]

пошук запису/поля:
mmorph -C класів [ -фу ] [ -E | -O ] [ -b | [ -k ] [ -B клас ]]
-m morphfile [ -d debug_map ] [ -l файл журналу ] [ infile [ вихідний файл ]]

дамп бази даних:
mmorph -p | -q
-m morphfile [ -d debug_map ] [ -l файл журналу ] [ infile [ вихідний файл ]]

ОПИС


У найпростішому режимі роботи, лише з -m morphfile варіант mmorph працює в Росії
режим пошуку: відкриється існуюча база даних під назвою morphfile.db і шукати все
сегменти рядка (зазвичай відповідають словам) у вхідних даних.

Щоб створити базу даних із лексичних записів, указаних у "morphfile", використовуйте -c -m
morphfile. Файл morphfile.db не повинно існувати. Коли база даних буде завершена, це буде
пошук сегментів у вхідних даних. Якщо використовується неактивно (вхід і вихід є терміналом), a
запит друкується, коли програма очікує, що користувач введе сегментний рядок. Немає
підказка відбувається в режимі запис/поле.

Щоб перевірити застосування правил на лексичних записах, зазначених у morphfile, без
створити базу даних і, не шукаючи сегментів, використовувати -n -m morphfile, це
автоматично встановлює рівень трасування на 1, якщо його не було вказано.

Для виконання тих самих операцій, що й вище, але з альтернативним набором лексичних записів
in addfile, скористайтеся додатковим параметром -a addfile. Лексичні записи в morphfile будуть
ігнорується. Це корисно під час внесення доповнень до стандартного морфологічного опису.
Майте на увазі, що записи додано до бази даних morphfile.db не замінювати існуючі.

Як до тест a морфологічні description
Використовувати -n варіант. У розділі Граматика вкажіть цільові правила, які будуть відповідати бажаному
результати. У розділі Лексикон вкажіть лексичні одиниці, які ви хочете перевірити. При бігу
усі правила будуть застосовані (рекурсивно) до лексичних одиниць, якщо правило є метою, тоді
результат застосування друкується на виході.

Пропозиція: розділіть дві частини, згадані вище (правила цілей і розділ «Лексикон»)
файли та посилайтеся на ці файли за допомогою an #включати директиви, де вони мають відбуватися в
основний вхідний файл.

Якщо ви використовуєте існуючий опис і хочете перевірити лише нові лексичні записи, використовуйте
варіанти -n -a addfileі вставте лексичні записи addfile.

ВАРІАНТИ


-a addfile
Ігнорувати лексичні записи в morphfile, взяти їх з addfile замість цього.

-B клас
Визначає клас запису, який стоїть перед початком речення.
Слова з великої літери, які трапляються відразу після таких записів, також шукатимуться з усіма
їхні літери перетворено на малі (відповідно до LC_CTYPE, див. нижче).

-b складіть футляр перед пошуком. Великі літери перетворюються на малі
(відповідно до LC_CTYPE, див. нижче) перед пошуком слова.

-C класів
Визначає режим запису/поля. Визначає класи записів, які слід переглядати
вгору. Імена класів повинні бути розділені комами ",", TAB, пробілом, рискою "|" або зворотна коса риска
"\".

-c Створіть нову базу даних для пошуку. Ім'я створеного файлу - це ім'я
morphfile (-m варіант) із суфіксом .db. Воно не повинно існувати; якщо він існує користувач
слід видалити його вручну перед запуском mmorph -c (це мінімальний захист
проти випадкового перезапису бази даних, на що може знадобитися багато часу
створити).

-d debug_map
Укажіть, які параметри налагодження потрібні. Кожен біт в debug_map відповідає ан
варіант.
біт десяткове шістнадцяткове призначення
немає бітів 0 0x0 немає опції налагодження (за замовчуванням)
1 1 0x1 ініціалізація налагодження
2 2 0x2 налагодити аналіз yacc
3 4 0x4 комбінація правил налагодження
4 8 0x8 програма для перевірки орфографії
5 16 0x10 статистика друку з параметрами -p або -q
усі біти -1 0xffff усі параметри налагодження, якими б вони не були
Щоб об’єднати параметри, додайте разом десяткові чи шістнадцяткові значення. Приклад: -t 0x5
визначає біти (опції) 1 і 4.

-E У режимі запис/поле розширює морфологічні анотації, якщо вони вже існують (
за замовчуванням наявні анотації залишаються як є).

-O У режимі запису/поля перезапишіть анотації морфології, якщо вони вже існують
(за умовчанням наявні анотації залишаються як є).

-f Очищайте вихідні дані після кожного пошуку сегмента. Це корисно лише для введення та виведення
передаються від і до програми, яка повинна їх синхронізувати.

-h Роздрукувати довідку та вийти.

-i Додайте перед результатом кожного пошуку ідентифікатор вхідного сегмента
відповідає. Наразі вхідні сегменти ідентифікуються за їхнім порядковим номером,
починаючи з 0. З цією вказівкою додатковий новий рядок, що розділяє рішення
для різних вхідних сегментів не друкується, оскільки він не потрібен. Якщо пошук
не має рішень, лише ідентифікатор сегмента друкується на виході. Сегмент
ідентифікатор також додається до відхилених сегментів. Табуляція завжди йде після
ідентифікатор сегмента.

-k запасний складаний футляр. Якщо пошук слова не вдався, перетворіть усі великі літери на
малим регістром і спробуйте знайти ще раз. (перетворення виконується відповідно до LC_CTYPE, див
нижче).

-l файл журналу
Вкажіть файл для запису трасування та повідомлень про помилки. Стандартна помилка.

-m morphfile
Вкажіть файл, що містить опис морфології. Побачити mmorph (5) для
опис синтаксису формалізму.

-n Немає створення бази даних або пошуку (тестовий режим).

-p Дамп надрукованої бази даних структури функцій у вихідний файл (або стандартний вихід). The
кількість окремих tfs надається у файлі журналу (або стандартна помилка), якщо біт 5 налагодження
опція встановлена.

-q Вивести форми в базу даних у вихідний файл (або стандартний вихід). Трохи статистики
надаються у файлі журналу (або стандартна помилка), якщо встановлено біт 5 параметра налагодження.

-r Rejectfile
У режимі без запису/поля вказує файл, куди записувати вхідні сегменти
не можна було шукати. Стандартна помилка.

-s trace_level
Застосування правила орфографії:
0 без трасування (за замовчуванням).
1 слід дійсних форм поверхні.
2 правила трасування, лексична частина яких збігається.
3 trace surface лівий контекстний збіг (побудова поверхневого слова).
4 невідповідність правого контексту поверхні трасування та блокування правила.
5 правило трасування не блокує.
Trace_level передбачає всі попередні.

-t trace_level
Укажіть рівень трасування для застосування правила:
0 без трасування (за замовчуванням).
1 Застосовуються правила трасування голів.
2 відстежте всі правила, які застосовуються, відступ вказує на глибину рекурсії.
10 відстеження також правил, які випробували, але не застосували
Trace_level передбачає всі попередні.

-U У режимі запис/поле невідомі слова (тобто, які були невдало знайдені).
позначений ??\??.

-v Роздрукувати версію та вийти.

-y Лише синтаксичний аналіз: не обробляйте опис, крім перевірки синтаксису. Поки
розробляючи опис морфології, ви можете використовувати цей параметр для виявлення синтаксичних помилок
швидко після кожної модифікації, перш ніж запустити її "по-справжньому".

-z означає -y. Проаналізуйте та виведіть лексичні описи в нормалізованому вигляді.

infile файл, що містить сегменти для пошуку, по одному на рядок. За замовчуванням стандарт
Вхід

вихідний файл
файл, у якому записаний результат роботи програми. Один рядок на рішення.
Розв’язки різних вхідних сегментів розділені порожнім рядком. За замовчуванням
стандартний вихід.

WORD ГРАМАТИКА І Заклинання ПРАВИЛА


Для детального опису принципів і механізмів, що використовуються в mmorph, будь ласка зверніться до
документи, наведені в розділі ТАКОЖ нижче.

Коротко накреслені морфосинтаксичні описи, написані для mmorph, описують, як бувають слова
побудований конкатенацією морфем, і як змінюється цей процес конкатенації
правопис цих морфем. Уточнюється перша частина – граматика будови слова
правилами вільного перезапису з обмеженим контекстом, формалізм яких натхненний уніфікацією
системи (пор. Shieber 1986). Друга частина, орфографічні зміни, уточнюється
правила орфографії у формалізмі, заснованому на дворівневій моделі морфології. Цей підхід
до морфології описано у Ritchie, Russell et. al, 1992 і більш стисло в Pulman
і Хеппл 1993.

НАВКОЛИШНЄ СЕРЕДОВИЩЕ ЗМІННІ


Щоб вирішити, які символи відображаються на виводі, mmorph використовує мову
конкретний опис того setlocale(3) набори відповідно до змінної середовища
LC_CTYPE. Для мов, з якими працює MULTEXT, це гарна ідея мати це
змінна встановлена ​​на iso_8859_1.

ПРИКЛАДИ


Ось короткий виклад загального використання параметрів mmorph:

mmorph -n -m morphfile
Тестовий режим: читає весь morphfile і друкує результати зі стандартною помилкою. Немає бази даних
створюється, слова не шукаються.

mmorph -c -m morphfile
Створення бази даних: читає весь morphfile і зберігає результати в базі даних
(morphfile.db). Введені структури ознак збираються в окремому файлі
(morphfile.tfs). Стандартний ввід читається для слів для пошуку в новій базі даних.

mmorph -m morphfile
Режим пошуку: читає лише розділи алфавітів, атрибутів і типів morphfile.
Стандартний ввід читається для слів, які потрібно знайти відповідно до існуючої бази даних
(mmorphfile.db і morphfile.tfs).

mmorph -m morphfile -a addfile
Режим додавання: ігнорує розділ Lexicon morphfile, але консультується з addfile і
результати додаються до бази даних. Стандартний ввід читається для пошуку слів
згідно з доповненою базою даних (mmorphfile.db та morphfile.tfs).

ДІАГНОСТИКА


Повідомлення про помилки мають бути зрозумілими. Будь ласка зверніться до mmorph(5) для формального
опис синтаксису.

Використовуйте mmorph онлайн за допомогою сервісів onworks.net


Безкоштовні сервери та робочі станції

Завантажте програми для Windows і Linux

  • 1
    ЛАГІТ
    ЛАГІТ
    SWIG – це інструмент розробки програмного забезпечення
    що з'єднує програми, написані на C і
    C++ з різноманітними високорівневими
    мови програмування. SWIG використовується з
    інший...
    Завантажити SWIG
  • 2
    Тема WooCommerce Nextjs React
    Тема WooCommerce Nextjs React
    Тема React WooCommerce, створена за допомогою
    Next JS, Webpack, Babel, Node і
    Express, використовуючи GraphQL і Apollo
    Клієнт. Магазин WooCommerce в React(
    містить: Продукти...
    Завантажте тему WooCommerce Nextjs React
  • 3
    archlabs_repo
    archlabs_repo
    Сховище пакетів для ArchLabs Це
    додаток, який також можна отримати
    від
    https://sourceforge.net/projects/archlabs-repo/.
    Його розміщено в OnWorks у...
    Завантажити archlabs_repo
  • 4
    Проект Зефір
    Проект Зефір
    Проект Zephyr – це нове покоління
    операційна система реального часу (RTOS).
    підтримує декілька апаратних засобів
    архітектури. Він заснований на а
    ядро малої площі...
    Завантажити Zephyr Project
  • 5
    SCONS
    SCONS
    SCons - це інструмент для створення програмного забезпечення
    що є кращою альтернативою
    класичний інструмент "Make" для створення
    ми всі знаємо і любимо. SCons є
    впроваджено...
    Завантажити SCons
  • 6
    PSeInt
    PSeInt
    PSeInt - це інтерпретатор псевдокоду для
    іспаномовні студенти програмування.
    Його головне призначення – бути інструментом для
    навчання та розуміння основ
    концепція...
    Завантажити PSeInt
  • Детальніше »

Команди Linux

Ad