InglésFrancésEspañol

Ad


icono de página de OnWorks

kakasi - Online en la nube

Ejecute kakasi en el proveedor de alojamiento gratuito OnWorks sobre Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando kakasi que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


KAKASI - Inversor simple Kanji kana (entre Kanji, tanto Kana como Romaji)

SINOPSIS


kakasi [opciones] [jisyo1 [jisyo2 [jisyo1 ,,]]]

DESCRIPCIÓN


KAKASI En japonés, las oraciones a menudo se componen de una mezcla de caracteres chinos (Kanji),
Kana (Hiragana y Katakana) y Romaji (pronunciación fonética latina). Este programa
convierte entre estas cuatro formas diferentes de escribir japonés.

Este programa es útil para aquellos cuyo terminal o escritorio no es compatible con el nativo
visualización de japonés. Además, esta es una gran herramienta para aquellos que están aprendiendo japonés.
(estudiantes internacionales y niños, etc.).

Se puede pasar una palabra a la entrada estándar (stdin), luego se traduce y se envía a
salida estándar (salida estándar). En el siguiente ejemplo, el kanji "bunchu" se convierte en
hiragana.

kakasi -JH <documento

Desde la versión 2.3.0 se admite texto con espacios entre palabras. En el
En el siguiente ejemplo, la salida tiene espacios entre cada palabra.

kakasi -w <documento

Desde la versión 2.3.5, se admite el modo de conversión de nivel. En el siguiente ejemplo,
los Kanjis simples se dejan sin convertir, y los Kanjis difíciles se traducen en
hiragana.

kakasi -l4 <documento

KAKASI Es posible convertir letras a caracteres alfabéticos. También Katakana
Las letras en el juego de caracteres JIS x0201 y el Hiragana en el juego de caracteres JIS x0208 pueden
ser convertidos entre sí.

KAKASI El siguiente juego de caracteres entre paréntesis que se muestra.

ASCII (a) Conocido como conjunto de caracteres "ascii".

JIS ROMAN (j)
Conocido como conjunto de caracteres "jis roman".

GRÁFICO (g)
Es el conjunto de caracteres gráficos DEC.

katakana (k)
JIS x0201, definido como parte del juego de caracteres GR.

Como cuestión de conveniencia, JIS x0208 se divide como se indica a continuación.

Kanji (J)
Caracteres JIS x0208 incluidos entre 16 y 94 secciones.

Hiraganá (H)
Caracteres JIS x0208 incluidos en la sección 4 (Hiragana)

Katakana (K)
Caracteres JIS x0208 incluidos en la sección 5 (Katakana)

Signo (E)
Caracteres JIS x0208 incluidos en la sección 1,2,3,6,7, 8, XNUMX, XNUMX, XNUMX y XNUMX. (Tenga en cuenta que la sección
9-15 no están definidos en JIS x0208.)

Se encuentran disponibles traducciones entre los siguientes conjuntos de caracteres.

ASCII -> JISROMAN, Signo

JISROMAN -> ASCII, signo

GRÁFICO -> ASCII, JISROMAN, Signo

JISx0201 Katakana
-> ASCII, JISROMAN, Kana, Hiragana

Firmar -> ASCII, JISROMAN

Katakana -> ASCII, JISROMAN, JISx0201 Katakana, Hiragana

Hiragana -> ASCII, JISROMAN, JISx0201 Katakana, Kana

Kanji -> ASCII, JISROMAN, JISx0201 Katakana, Kana, Hiragana

Con la conversión de ASCII y JISROMAN se realiza la conversión de caracteres alfabéticos
de JISx0201 Katakana, Katakana, Hiragana y Kanji.

Ejemplo:

1. Todos los caracteres kanji se convierten a Hiragana.

kakasi-JH

2. Todos los caracteres JIS x0208 se convierten a JIS X 0201.

kakasi -Hk -Kk -Jk -Ea

3. Todos los caracteres se convierten a JIS X 0208.

kakasi -aE -jE -gE -kK

4. Todos los caracteres se convierten a ascii y las palabras se separan.

kakasi-Ha-Ka-Ja-Ea-ka

5. Intercambio entre personajes Katakana e Hiragana.

kakasi-HK-KH

CONVERSIÓN DESIGNADO PERSONAJE SET


Algunos conjuntos de caracteres están categorizados por kakasi y se indican mediante los siguientes mnemónicos: a, j,
g, k, e, h, k, j.

a --- caracteres ASCII
j --- JIS ROMAN (casi igual a ASCII, "~" y "
diferente) definido por JIS x0201
g --- Caracteres gráficos DEC
k --- KATAKANA definido por JIS x0201

E, H, K y J se incluyen en el juego de caracteres JIS x0208.

J --- Caracteres KANJI de JIS x0208.
H --- Caracteres HIRAGANA de JIS x0208.
K --- Caracteres KATAKANA de JIS x0208.
E --- El resto de los caracteres anteriores de JIS x0208 que incluye
alfabetos, números, símbolos, etc.

- (de) (a) significa conversión del juego de caracteres (de) a (a). Por ejemplo, opción -JK
hace que los caracteres KANJI se conviertan a HIRAGANA. Las combinaciones de la siguiente tabla son
disponible. (No debes recordarlo, porque la -h muestra la misma información)

a \ desde | ajk EHKJ g
------- + ------------------------------------------ -
un | - o o1 o o1 o1 o12 o
j | o - o1 o o1 o1 o12 o
k | - oo o2
E | oo - o
H | o-o o2
K | oo -

o - convertido.
1 - convertido a Romaji.
2 - Kanji -> Conversión de Kana.

Kanji CODIFICACIÓN CONVERSIÓN


Desafortunadamente, en Japón se utilizan varios sistemas de codificación y se cambia el estándar JIS x0208
en 1983. Por lo tanto, KAKASI puede distinguir automáticamente el sistema de codificación y la codificación
revisión y luego use el mismo sistema de codificación de salida si el documento no incluye JIS
x0201 KATAKANA. Si se incluye JIS x0201 KATAKANA o si desea cambiar la codificación kanji
sistema, puede utilizar las siguientes opciones.

-i: codificación de entrada
-o: codificación de salida

jis: ampliamente utilizado en Internet. (Ej: fj, jp, .. grupos de noticias)
Derivado de la forma de codificación ISO-2022.
newjis: JISx0208 (1983) invocado por ESC - $ - B.
oldjis: JISx0208 (1978) invocado por ESC - $ - @.
euc, dec: se usa a menudo en UNIX como computadoras. JISx0208 es
asignado a GR (MSB es 1). La principal diferencia entre
euc y dec es la asignación de JISx0201 KATAKANA y
el carácter gráfico DEC.
sjis: definido por Microsoft Corp. Ampliamente utilizado en el ámbito personal
computadoras (MSDOS, Mac, ..)
utf8: estándar internacional actual. Todos los sistemas operativos modernos usan esto
codificación del juego de caracteres Unicode como predeterminado.

ROMAJÍ CONVERSIÓN


Opciones de conversión de kanji kana. Usado con -J? opción. Hay 2 tipos de escritura Romaji.
El primero es el método Kunrei definido por el gobierno japonés, y el segundo es el
Método Hepburn. Creo que el método Hepburn suena naturalmente a los extranjeros.

-rhepburn: método Hepburn (predeterminado)
-rkunrei: Método Kunrei

OTROS CAMPUS


-p: enumera todas las lecturas posibles. Si existen dos o más
posibles lecturas, KAKASI las muestra entre llaves {aaa, bbb}.
-s: inserta un carácter separado entre las palabras.
-f: modo Furigana. Muestra la palabra kanji original con lectura.
-c: omite caracteres dentro de una palabra. (predeterminado TAB CR LF BLANK)
-C: escribir en mayúscula la palabra Romaji (con la opción -Ja o -Jj)
-U: palabra romaji en mayúsculas (con la opción -Ja o -Jj)
-u: Llama a fflush ().
-w: modo wakatigaki. 'wakatigaki' es la segmentación de palabras para
Frases japonesas.

DICCIONARIOS


KAKASI puede aceptar un diccionario adicional al diccionario del sistema. El formato aceptable
de diccionario adicional es SKK formato, y Wnn formato, etc. Es decir, cada registro es
una línea con dos campos, Yomi (lectura) y Jukugo (modismo). Los campos se separan con
comas (o TAB, o en blanco). El código kanji está restringido a JIS o EUC. Ver otro
documento llamado JISYO para más detalles.

MEDIO AMBIENTE VARIABLES


El comportamiento se ve afectado por las siguientes variables de entorno.

RUTA KANWADICTP
Especifica una ruta de kanwadict (ruta completa que incluye el nombre del archivo). El valor predeterminado es
/ usr / share / kakasi / kanwadict.

ITAIJIDICTPATH
Especifica una ruta de itaijidict (ruta completa que incluye el nombre del archivo). El valor predeterminado es
/ usr / share / kakasi / itaijidict.

Use kakasi en línea usando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

Comandos de Linux

Ad