англійськафранцузькаіспанська

Ad


Значок OnWorks

kakasi - онлайн у хмарі

Запустіть kakasi у постачальника безкоштовного хостингу OnWorks через Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

Це команда kakasi, яку можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

ПРОГРАМА:

ІМ'Я


KAKASI - простий інвертор канджі кана (між канджі, як кана, так і ромаші)

СИНТАКСИС


какасі [параметри] [jisyo1 [jisyo2 [jisyo1,,]]]

ОПИС


КАКАСИ У японських реченнях часто складають суміш китайських ієрогліфів (кандзі),
Кана (Хірагана і Катакана) і Ромадзі (латинська фонетична вимова). Ця програма
переходить між цими чотирма різними способами написання японською мовою.

Ця програма корисна для тих, чий термінал або робочий стіл не підтримують рідну
показ японської мови. Також це чудовий інструмент для тих, хто вивчає японську мову
(іноземні студенти та діти тощо).

Слово може бути передано в стандартний вхід (stdin), потім воно перекладається і виводиться
стандартний вихід (стандартний вихід). У наступному прикладі канджі "bunchu" конвертовано в
Хірагана.

kakasi -JH < документ

З версії 2.3.0 підтримується текст з пробілами між словами. В
У наступному прикладі виведення містить пробіли між кожним словом.

kakasi -w < документ

З версії 2.3.5 підтримується режим перетворення рівня. У наступному прикладі
прості канджі залишаються неперетвореними, а складні — перекладаються
Хірагана.

kakasi -l4 < документ

КАКАСИ Є можливість конвертувати літери в символи алфавіту. Також катакана
літери в наборі символів JIS x0201 і хірагана в наборі символів JIS x0208 можуть
перетворюватися між собою.

КАКАСИ Відображається наступний набір символів у дужках.

ASCII (a) Відомий як набір символів "ascii".

JISROMAN (j)
Відомий як набір символів "jis roman".

ГРАФІКА (г)
Це набір графічних символів DEC.

катакана (к)
JIS x0201, визначений як частина набору символів GR.

Для зручності JIS x0208 розділений, як зазначено нижче.

кандзі (J)
Символи JIS x0208 містять від 16 до 94 розділів.

хірагана (H)
Символи JIS x0208, включені в розділ 4 (Хірагана)

катакана (К)
Символи JIS x0208, включені в розділ 5 (Катакана)

Знак (E)
Символи JIS x0208, включені в розділи 1,2,3,6,7 і 8. (Зверніть увагу, що розділ
9-15 не визначені в JIS x0208.)

Доступний переклад між наступними наборами символів.

ASCII -> JISROMAN, Sign

JISROMAN -> ASCII, знак

ГРАФІКА -> ASCII, JISROMAN, Знак

JISx0201 Катакана
-> ASCII, JISROMAN, Кана, Хірагана

Знак -> ASCII, JISROMAN

Катакана -> ASCII, JISROMAN, JISx0201 Катакана, Хірагана

Хірагана -> ASCII, JISROMAN, JISx0201 Катакана, Кана

Канджі -> ASCII, JISROMAN, JISx0201 Катакана, Кана, Хірагана

З перетворенням ASCII та JISROMAN виконується перетворення алфавітних символів
від JISx0201 Катакана, Катакана, Хірагана та Кандзі.

приклад:

1. Усі символи кандзі перетворюються на хірагану.

какасі -JH

2. Усі символи JIS x0208 конвертуються в JIS X 0201.

какасі -Hk -Kk -Jk -Ea

3. Усі символи конвертуються в JIS X 0208.

какасі -аЕ -jE -gE -kK

4. Усі символи перетворюються на ascii, а слова відокремлюються.

какасі -Ха -Ка -Джа -Еа -ка

5. Обмін між символами катакана та хірагани.

какасі -HK -KH

КОНВЕРСІЯ ПРИЗНАЧЕНИЙ ХАРАКТЕР УСТАНОВКА


Деякі набори символів класифікуються за якасі та позначаються такими мнемоніками: a, j,
g, k, E, H, K, J.

a --- символи ASCII
j --- JIS ROMAN (майже дорівнює ASCII, "~" і "
різні ), визначені JIS x0201
g --- Графічні символи DEC
k --- KATAKANA, визначена JIS x0201

E, H, K і J входять до набору символів JIS x0208.

J --- Символи канджі JIS x0208.
H --- символи HIRAGANA JIS x0208.
K --- Символи KATAKANA JIS x0208.
E --- Решта вищезгаданих символів JIS x0208, які включають
алфавіти, цифри, символи тощо.

-(from)(to) означає перетворення набору символів (від) до (до). Наприклад, опція -JK
призводить до того, що символи KANJI перетворюються на HIRAGANA. Комбінації в наступній таблиці є
доступний. (Ви не повинні це пам'ятати, тому що -h показує ту саму інформацію)

до\з| ajk EHKJ g
-------+-------------------------------------------------- --
а | - o o1 o o1 o1 o12 o
j | о - о1 о о1 о1 о12 о
k | - оо о2
E | оо - о
H | о - о о2
K | оо -

o -- конвертований.
1 -- перетворено на Ромаджі.
2 -- Кандзі -> Перетворення кана.

КАНДЖІ КОДУВАННЯ КОНВЕРСІЯ


На жаль, в Японії використовується кілька систем кодування і змінено стандарт JIS x0208
в 1983 році. Таким чином, KAKASI може автоматично розрізняти систему кодування і кодування
перегляд, а потім використовувати ту саму вихідну систему кодування, якщо документ не містить JIS
x0201 КАТАКАНА. Якщо JIS x0201 KATAKANA включено або ви хочете змінити кодування кандзі
системи, ви можете скористатися наступними параметрами.

-i : кодування введення
-o : вихідне кодування

jis -- Широко використовується в Інтернеті. (Наприклад: fj, jp, .. групи новин)
Похідне від коду ISO-2022.
newjis: JISx0208 (1983), викликаний ESC-$-B.
oldjis: JISx0208 (1978), викликаний ESC-$-@.
euc,dec -- Часто використовується в UNIX, як комп'ютери. JISx0208 є
присвоєно GR ( MSB дорівнює 1 ). Основна різниця між
euc і dec є призначенням JISx0201 KATAKANA і
графічний символ DEC.
sjis -- Визначається корпорацією Microsoft. Широко використовується в персональних
комп'ютери (MSDOS, Mac, ..)
utf8 -- Поточний міжнародний стандарт. Всі сучасні ОС використовують це
кодування набору символів Unicode за замовчуванням.

РОМАЇ КОНВЕРСІЯ


Варіанти перетворення кандзі кандзі. Використовується з -J? варіант. Існує 2 типи письма ромаджі.
Перший – це метод Кунрея, визначений урядом Японії, а другий – метод
Метод Хепберна. Я думаю, що метод Хепберн звучить природно для іноземців.

-rhepburn : метод Хепберна (за замовчуванням)
-rkunrei : метод Кунрея

ІНШІ ВАРІАНТИ


-p: Перелік усіх можливих показань. Якщо їх два або більше
можливі показання, KAKASI показує їх у дужках {aaa,bbb}.
-s: вставте окремий символ між словами.
-f: режим Furigana. Показує оригінальне слово кандзі з читанням.
-c: пропуск символів у слові. (за замовчуванням TAB CR LF BLANK)
-C: Напишіть слово Ромадзі з великої літери (з опцією -Ja або -Jj)
-U: слово ромаджі з великими літерами (з опцією -Ja або -Jj)
-u: Викликати fflush().
-w: режим вакатигакі. «вакатигакі» — це сегментація слів
Японські речення.

СЛОВНИКИ


КАКАСИ може прийняти додатковий словник до системного словника. Прийнятний формат
додаткового словника є СКК формат, і Wnn формат і так далі. А саме кожен запис є
один рядок з двома полями, Йомі (читання) і Джукуго (ідіома). Поля відокремлюються за допомогою
коми (або TAB, або пробіл). Код кандзі обмежений JIS або EUC. Дивіться інше
документ під назвою JISYO для більш детальної інформації.

НАВКОЛИШНЄ СЕРЕДОВИЩЕ ЗМІННІ


На поведінку впливають наступні змінні середовища.

KANWADICTPATH
Вказує шлях до kanwadict (повний шлях, включаючи назву файлу). Значення за замовчуванням
/usr/share/kakasi/kanwadict.

ITAIJIDICTPATH
Вказує шлях itaijidict (повний шлях, включаючи назву файлу). Значення за замовчуванням
/usr/share/kakasi/itaijidict.

Використовуйте онлайн-какасі за допомогою служб onworks.net


Безкоштовні сервери та робочі станції

Завантажте програми для Windows і Linux

Команди Linux

Ad