InglêsFrancêsEspanhol

Executar servidores | Ubuntu > | Fedora > |


favicon do OnWorks

kakasi - Online na nuvem

Execute kakasi no provedor de hospedagem gratuita OnWorks no Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS

Este é o comando kakasi que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS

PROGRAMA:

NOME


KAKASI - inversor simples Kanji kana (entre Kanji, Kana e Romaji)

SINOPSE


kakasi [opções] [jisyo1 [jisyo2 [jisyo1 ,,]]]

DESCRIÇÃO


KAKASI Em japonês, as frases são frequentemente compostas por uma mistura de caracteres chineses (Kanji),
Kana (Hiragana e Katakana) e Romaji (pronúncia fonética latina). Este programa
converte entre essas quatro maneiras diferentes de escrever em japonês.

Este programa é útil para aqueles cujo terminal ou área de trabalho não suporta o nativo
exibição de japonês. Além disso, esta é uma ótima ferramenta para aqueles que estão aprendendo japonês
(estudantes internacionais e crianças, etc.).

Uma palavra pode ser passada para a entrada padrão (stdin), então é traduzida e enviada para
saída padrão (saída padrão). No exemplo a seguir, o Kanji "bunchu" é convertido em
Hiragana.

kakasi -JH <document

Desde a versão 2.3.0, há suporte para texto com espaços entre as palavras. No
a seguir o exemplo a saída tem espaços entre cada palavra.

kakasi -w <document

Desde a versão 2.3.5, o modo de conversão de nível é suportado. No exemplo a seguir,
Kanjis simples não são convertidos, e Kanjis difíceis são traduzidos para
Hiragana.

kakasi -l4 <documento

KAKASI É possível converter letras em caracteres alfabéticos. Também katakana
letras no conjunto de caracteres JIS x0201 e os Hiragana no conjunto de caracteres JIS x0208 podem
ser convertidos entre si.

KAKASI O seguinte caractere definido entre colchetes que é exibido.

ASCII (a) Conhecido como conjunto de caracteres "ascii".

JISROMAN (j)
Conhecido como conjunto de caracteres "jis roman".

GRÁFICO (g)
É o conjunto de caracteres gráficos DEC.

Katakana (k)
JIS x0201, definido como parte do conjunto de caracteres GR.

Por uma questão de conveniência, JIS x0208 está dividido conforme indicado abaixo.

Kanji (J)
Caracteres JIS x0208 incluídos entre 16 e 94 seções.

Hiragana (H)
Personagens JIS x0208 incluídos na seção 4 (Hiragana)

Katakana (K)
Caracteres JIS x0208 incluídos na seção 5 (Katakana)

Sinal (E)
Caracteres JIS x0208 incluídos na seção 1,2,3,6,7 e 8. (Observe que a seção
9-15 são indefinidos em JIS x0208.)

A tradução entre os seguintes conjuntos de caracteres está disponível.

ASCII -> JISROMAN, Sign

JISROMAN -> ASCII, Sign

GRÁFICO -> ASCII, JISROMAN, Sinal

JISx0201 Katakana
-> ASCII, JISROMAN, Kana, Hiragana

Sinal -> ASCII, JISROMAN

Katakana -> ASCII, JISROMAN, JISx0201 Katakana, Hiragana

Hiragana -> ASCII, JISROMAN, JISx0201 Katakana, Kana

Kanji -> ASCII, JISROMAN, JISx0201 Katakana, Kana, Hiragana

Com a conversão de ASCII e JISROMAN, a conversão de caracteres alfabéticos é feita
de JISx0201 Katakana, Katakana, Hiragana e Kanji.

Exemplo:

1. Todos os caracteres kanji são convertidos em hiragana.

kakasi -JH

2. Todos os caracteres JIS x0208 são convertidos em JIS X 0201.

kakasi -Hk -Kk -Jk -Ea

3. Todos os caracteres são convertidos para JIS X 0208.

kakasi -aE -jE -gE -kK

4. Todos os caracteres são convertidos para ascii e as palavras são separadas.

kakasi -Ha -Ka -Ja -Ea -ka

5. Troca entre personagens Katakana e Hiragana.

kakasi -HK -KH

CONVERSÃO DESIGNADO CARÁCTER SET


Alguns conjuntos de caracteres são categorizados por kakasi e indicados pelos seguintes mnemônicos: a, j,
g, k, E, H, K, J.

a --- caracteres ASCII
j --- JIS ROMAN (quase igual a ASCII, "~" e "
diferente) definido por JIS x0201
g --- Caracteres gráficos DEC
k --- KATAKANA definido por JIS x0201

E, H, K e J estão incluídos no conjunto de caracteres JIS x0208.

Personagens J --- KANJI de JIS x0208.
H --- HIRAGANA personagens de JIS x0208.
Personagens K --- KATAKANA de JIS x0208.
E --- Resto dos caracteres acima de JIS x0208 que inclui
alfabetos, números, símbolos e assim por diante.

- (de) (para) significa a conversão do conjunto de caracteres (de) para (para). Por exemplo, opção -JK
faz com que os caracteres KANJI sejam convertidos em HIRAGANA. As combinações na tabela a seguir são
acessível. (Você não deve se lembrar disso, porque o -h mostra a mesma informação)

para \ de | ajk EHKJ g
------- + ------------------------------------------ -
um | - o o1 o o1 o1 o12 o
j | o - o1 o o1 o1 o12 o
k | - oo o2
E | oo - o
H | o - o o2
K | oo -

o - convertido.
1 - convertido em Romaji.
2 - Kanji -> conversão de Kana.

KANJI CODIFICAÇÃO CONVERSÃO


Infelizmente, vários sistemas de codificação são usados ​​no Japão e o padrão JIS x0208 foi alterado
em 1983. Portanto, KAKASI pode distinguir automaticamente o sistema de codificação e codificação
revisão e, em seguida, usar o mesmo sistema de codificação de saída se o documento não incluir JIS
x0201 KATAKANA. Se JIS x0201 KATAKANA estiver incluído ou você deseja alterar a codificação de kanji
sistema, você pode usar as próximas opções.

-i: codificação de entrada
-o: codificação de saída

jis - Muito utilizado na internet. (Ex: fj, jp, .. newsgroups)
Derivado da forma de codificação ISO-2022.
newjis: JISx0208 (1983) invocado por ESC - $ - B.
oldjis: JISx0208 (1978) invocado por ESC - $ - @.
euc, dec - Frequentemente usado em computadores como UNIX. JISx0208 é
atribuído a GR (MSB é 1). A principal diferença entre
euc e dec é atribuição de JISx0201 KATAKANA e
o caracter gráfico DEC.
sjis - Definido pela Microsoft Corp. amplamente usado no pessoal
computadores (MSDOS, Mac, ..)
utf8 - Padrão internacional atual. Todos os sistemas operacionais modernos usam isso
codificação do conjunto de caracteres Unicode como padrão.

ROMAJI CONVERSÃO


Opções de conversão de kanji kana. Usado com -J? opção. Existem 2 tipos de escrita Romaji.
O primeiro é o método Kunrei definido pelo governo japonês, e o segundo é o
Método de Hepburn. Acho que o método Hepburn soa naturalmente para os estrangeiros.

-rhepburn: Método Hepburn (padrão)
-rkunrei: Método Kunrei

OUTROS OPÇÕES


-p: Lista todas as leituras possíveis. Se houver dois ou mais
leituras possíveis, KAKASI mostra-as entre colchetes {aaa, bbb}.
-s: Insere um caractere separado entre as palavras.
-f: modo Furigana. Mostra a palavra kanji original com leitura.
-c: pula caracteres dentro da palavra. (padrão TAB CR LF BLANK)
-C: Capitalize a palavra Romaji (com a opção -Ja ou -Jj)
-U: palavra romaji maiúscula (com a opção -Ja ou -Jj)
-u: chama fflush ().
-w: modo wakatigaki. 'wakatigaki' é a segmentação de palavras para
Frases japonesas.

DICIONÁRIOS


KAKASI pode aceitar dicionário adicional ao dicionário do sistema. O formato aceitável
de dicionário adicional é SKK formato, e Wnn formato e assim por diante. Ou seja, cada registro é
uma linha com dois campos, Yomi (leitura) e Jukugo (idioma). Os campos são separados por
vírgulas (ou TAB ou espaço em branco). O código kanji é restrito a JIS ou EUC. Ver outro
documento denominado JISYO para obter mais detalhes.

MEIO AMBIENTE VARIÁVEIS


O comportamento é afetado pelas seguintes variáveis ​​de ambiente.

KANWADICTPATH
Especifica um caminho de kanwadict (caminho completo incluindo o nome do arquivo). O valor padrão é
/ usr / share / kakasi / kanwadict.

CAMINHO DE ITAIJIDICT
Especifica um caminho de itaijidict (caminho completo incluindo o nome do arquivo). O valor padrão é
/ usr / share / kakasi / itaijidict.

Use kakasi online usando serviços onworks.net


Ad


Ad