Це команда langidentp, яку можна запустити у безкоштовного хостинг-провайдера OnWorks за допомогою однієї з наших безкоштовних онлайн-робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS
ПРОГРАМА:
ІМ'Я
langident - визначає мовні файли, на яких записані
СИНТАКСИС
langident [ПАРАМЕТИ] файл1 [файл2 ...]
ОПИС
Ідентифікує мовні файли, написані за допомогою модуля Perl Lingua::Identify.
ВАРІАНТИ
-a
Показати всі результати (не лише найімовірнішу мову).
-c
Показати рівень достовірності для найімовірнішої мови (це буде перше значення відразу після
найімовірніша мова).
-d
Налагодження (тільки для розробки).
-E КОДУВАННЯ
Виберіть кодування введення. За замовчуванням UTF-8.
# використовувати ISO-8859-1 (latin1)
файл langident -E ISO-8859-1
-e МЕТОДИ
Виберіть метод(и) для використання. Є три способи зробити це:
# просто використовуючи метод
файл langident -e ngrams3
# за допомогою кількох методів (розділіть їх комою)
langident -e префікси3,суфікси3
# використовуючи кілька методів і присвоюючи різну вагу кожному з них
langident -e smallwords=2,prefixes=1,ngrams3=1.3
Доступні такі методи: маленькі слова, префікси1, префікси2, префікси3,
префікси4, суфікси1, суфікси2, суфікси3, суфікси4, ngrams1, ngrams2, ngrams3 та
ngrams4.
-h
Відобразити довідкове повідомлення та вийти.
-l
Перелічіть усі доступні мови та вийдіть.
-m НОМЕР
Встановити максимальну кількість результатів (мов) для відображення (показує N найімовірніших мов,
за спаданням ймовірності).
Замінює перемикач -a.
-o МОВИ
Працюйте лише з указаними мовами.
# ідентифікувати лише португальською та англійською мовами
langident -o pt,en *
-p
Також показуйте відсотки.
-s SIZE
Максимальний розмір для перевірки.
-v
Показати версію та вийти.
ПРИКЛАДИ
Використовуйте методи ngrams2 і ngrams1, призначаючи подвійну важливість ngrams2 (-e
перемикач); вихідні дані включатимуть три найімовірніші мови (перемикач -m) зі своїм
відсотки (перемикач -p), а також рівень достовірності (перемикач -c) першого результату.
$ langident -e ngrams2=2,ngrams1 -c -p -m 3 README
README:en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$
TO DO
· Додайте перемикач для ігнорування тегів HTML (і, можливо, також інших форматів)
Використовуйте langidentp онлайн за допомогою сервісів onworks.net