АнглийскийФранцузскийИспанский

Ad


Значок OnWorks

kakasi - Интернет в облаке

Запустите kakasi в бесплатном хостинг-провайдере OnWorks через Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS

Это команда kakasi, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


КАКАСИ - простой преобразователь кандзи кана (между кандзи, каной и ромадзи)

СИНТАКСИС


Какаси [опции] [джисё1 [джисё2 [jisyo1 ,,]]]

ОПИСАНИЕ


КАКАСИ В японских предложениях часто используется смесь китайских иероглифов (кандзи),
Кана (хирагана и катакана) и ромадзи (латинское фонетическое произношение). Эта программа
преобразуется между этими четырьмя разными способами написания японского языка.

Эта программа полезна для тех, чей терминал или рабочий стол не поддерживает родную
отображение японского языка. Также это отличный инструмент для тех, кто изучает японский язык.
(иностранные студенты и дети и т. д.).

Слово можно передать на стандартный ввод (stdin), затем оно будет переведено и выведено на
стандартный вывод (stdout). В следующем примере кандзи "бунчу" преобразовано в
Хирагана.

kakasi -JH <документ

Начиная с версии 2.3.0 поддерживается текст с пробелами между словами. в
В следующем примере вывод имеет пробелы между каждым словом.

kakasi -w <документ

Начиная с версии 2.3.5 поддерживается режим преобразования уровней. В следующем примере
простые канджи остаются не преобразованными, а сложные канджи переводятся на
Хирагана.

kakasi -l4 <документ

КАКАСИ Возможно преобразование букв в алфавитные символы. Также катакана
буквы в наборе символов JIS x0201 и хирагана в наборе символов JIS x0208 могут
преобразовываться между собой.

КАКАСИ Отображается следующий набор символов в скобках.

ASCII (a) Известный как набор символов ascii.

ДЖИСРОМАН (j)
Набор символов, известный как "jis roman".

ГРАФИКА (г)
Это набор графических символов DEC.

Катакана (к)
JIS x0201, определенный как часть набора символов GR.

Для удобства JIS x0208 разделен, как указано ниже.

Кандзи (Дж)
Символы JIS x0208 включают от 16 до 94 разделов.

Хирагана (Д)
Символы JIS x0208, включенные в раздел 4 (хирагана)

Катакана (K)
Символы JIS x0208, включенные в раздел 5 (Катакана)

Знак (E)
Символы JIS x0208, включенные в разделы 1,2,3,6,7, 8, XNUMX, XNUMX, XNUMX и XNUMX. (Обратите внимание, что раздел
9-15 не определены в JIS x0208.)

Доступен перевод между следующими наборами символов.

ASCII -> ДЖИСРОМАН, Знак

ДЖИСРОМАН -> ASCII, Знак

ГРАФИКА -> ASCII, ДЖИСРОМАН, Знак

JISx0201 Катакана
-> ASCII, ДЖИСРОМАН, Кана, Хирагана

Знак -> ASCII, JISROMAN

Катакана -> ASCII, JISROMAN, JISx0201 Катакана, Хирагана

Хирагана -> ASCII, JISROMAN, JISx0201 Катакана, Кана

Кандзи -> ASCII, JISROMAN, JISx0201 Катакана, Кана, Хирагана

При преобразовании ASCII и JISROMAN выполняется преобразование алфавитных символов.
из JISx0201 Катакана, Катакана, Хирагана и Кандзи.

Пример:

1. Все символы кандзи преобразованы в хирагану.

какаси -JH

2. Все символы JIS x0208 преобразуются в JIS X 0201.

какаси -Hk -Kk -Jk -Ea

3. Все символы преобразованы в JIS X 0208.

какаси -aE -jE -gE -kK

4. Все символы преобразуются в ascii, а слова разделяются.

какаси-Ха-Ка-Джа-Эа-ка

5. Обмен между персонажами катаканы и хираганы.

какаси -HK -KH

Конверсия НАЗНАЧЕН ПЕРСОНАЖ УСТАНОВКА


Некоторые наборы символов классифицируются какаси и обозначаются следующими мнемониками: a, j,
ж, к, е, ч, к, дж.

a --- символы ASCII
j --- JIS ROMAN (почти равно ASCII, "~" и "
разные), определенные JIS x0201
g --- Графические символы DEC
k --- KATAKANA определяется JIS x0201

E, H, K и J включены в набор символов JIS x0208.

J --- символы KANJI из JIS x0208.
H --- HIRAGANA персонажи из JIS x0208.
K --- KATAKANA символы JIS x0208.
E --- Остальные вышеперечисленные символы JIS x0208, который включает
алфавиты, числа, символы и так далее.

- (из) (в) означает преобразование из набора символов (из) в (в). Например, опция -JK
вызывает преобразование символов КАНДЗИ в ХИРАГАНА. Комбинации в следующей таблице являются
доступный. (Вы не должны запоминать это, потому что -h показывает ту же информацию)

в \ из | ajk EHKJ g
------- + ------------------------------------------ -
а | - o o1 o o1 o1 o12 o
j | о - о1 о о1 о1 о12 о
k | - oo o2
E | оо - о
H | о - о о2
K | оо -

о - преобразован.
1 - преобразован в ромадзи.
2 - Кандзи -> Преобразование Кана.

КАНДЗИ КОДИРОВАНИЕ Конверсия


К сожалению, в Японии используется несколько систем кодирования и изменен стандарт JIS x0208.
at 1983. Таким образом, KAKASI может автоматически различать систему кодирования и кодировку
ревизию, а затем используйте ту же систему кодирования вывода, если документ не включает JIS
x0201 КАТАКАНА. Если JIS x0201 KATAKANA включен или вы хотите изменить кодировку кандзи
системе, вы можете использовать следующие параметры.

-i: кодировка ввода
-o: кодирование вывода

jis - широко используется в Интернете. (Пример: группы новостей fj, jp, ..)
На основе метода кодирования ISO-2022.
newjis: JISx0208 (1983) вызывается ESC - $ - B.
oldjis: JISx0208 (1978) вызывается ESC - $ - @.
euc, dec - Часто используется в UNIX-подобных компьютерах. JISx0208 - это
присвоено GR (MSB = 1). Основное различие между
euc и dec - присвоение JISx0201 KATAKANA и
графический символ DEC.
sjis - определено корпорацией Майкрософт. Широко используется в личных целях.
компьютеры (MSDOS, Mac, ..)
utf8 - Текущий международный стандарт. Все современные ОС используют это
кодировка набора символов Unicode по умолчанию.

РОМАХИ Конверсия


Варианты преобразования кандзи кана. Используется с -J? вариант. Есть 2 типа письма ромадзи.
Первый - это метод Кунрей, определенный правительством Японии, а второй - метод
Метод Хепберна. Я думаю, что метод Хепберн естественен для иностранцев.

-rhepburn: Метод Хепберна (по умолчанию)
-rkunrei: Метод Кунрей

ДРУГИЕ ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ


-p: перечислить все возможные значения. Если существует два или более
возможные значения, КАКАСИ показывает их в фигурных скобках {aaa, bbb}.
-s: вставить отдельный символ между словами.
-f: режим Furigana. Показывает исходное слово кандзи при чтении.
-c: пропускать символы в слове. (по умолчанию TAB CR LF BLANK)
-C: писать слово ромадзи с заглавной буквы (с опцией -Ja или -Jj)
-U: слово ромадзи в верхнем регистре (с опцией -Ja или -Jj)
-u: вызвать fflush ().
-w: режим вакатигаки. "вакатигаки" - это сегментация слов для
Японские предложения.

СЛОВАРЬ


КАКАСИ может принимать дополнительный словарь к системному словарю. Приемлемый формат
дополнительного словаря SKK формат и Внн формат и так далее. А именно, каждая запись
одна строка с двумя полями: Ёми (чтение) и Дзюкуго (идиома). Поля разделены
запятые (или TAB, или пробел). Код кандзи ограничен JIS или EUC. Увидеть другой
документ под названием JISYO для более подробной информации.

ОКРУЖАЮЩАЯ СРЕДА ПЕРЕМЕННЫЕ


На поведение влияют следующие переменные среды.

КАНВАДИКТПАТ
Задает путь к канвадикту (полный путь, включая имя файла). Значение по умолчанию
/ usr / share / kakasi / kanwadict.

ИТАИДЖИДИКТПАТ
Задает путь к itaijidict (полный путь, включая имя файла). Значение по умолчанию
/ usr / share / kakasi / itaijidict.

Используйте kakasi онлайн с помощью сервисов onworks.net


Бесплатные серверы и рабочие станции

Скачать приложения для Windows и Linux

Команды Linux

Ad