InglésFrancésEspañol

Ejecutar servidores | Ubuntu > | Fedora > |


icono de página de OnWorks

kcc - Online en la nube

Ejecute kcc en el proveedor de alojamiento gratuito de OnWorks sobre Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando kcc que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


kcc: convertidor de código kanji con detección automática de codificación

SINOPSIS


kcc [ -IOchnvxz ] [ -b tamaño buf ] [ presentar ]

DESCRIPCIÓN


kcc es un filtro que lee presentar secuencialmente, convierte codificaciones kanji y salida a
stdout. Si no se especifica ningún archivo o se especifica - como nombre de archivo, se lee desde stdin. Usted puede
especificar codificaciones kanji para entrada / salida. Sin embargo, kcc detectar codificación de entrada automáticamente,
si no especifica la codificación de entrada.

Las codificaciones kanji disponibles son JIS (7 bits y / o 8 bits), Shift JISEUCDEC. Para la entrada
codificación, puede mezclar cuando estos son pares de uno de EUC DEC o Shift JIS y 7 bit JIS.
SI/SOESC (se me reconoce como la mitad de ancho de JIS.

OPCIONES


-O
-IO I para la codificación kanji de entrada¡¤O para la codificación kanji de salida. Cuando no hay codificación de entrada
especificado, se detectará automáticamente, y si ambas entradas / salidas no
especificado, la codificación de salida es JIS de 7 bits.

Puede especificar uno de los siguientes para la opción de codificación de entrada, I.

e EUC (disponible con JIS de 7 bits)
d DEC (disponible con JIS de 7 bits)
s Shift JIS (disponible con JIS de 7 bits)
j7 or k
JIS de 7 bits
8 JIS de 8 bits

Puede especificar uno de los siguientes para la opción de codificación de salida, O.

e EUC
d Diciembre
s Cambiar JIS
jXY or 7XY
JIS de 7 bits (utilizandoSI/SO para designación JIS kana)
kXY JIS de 7 bits (utilizandoESC (yo para designación JIS kana)
8XY JIS de 8 bits

By XY in O opción, puede especificar qué secuencia de escape se utiliza en la codificación JIS. BJ
es predeterminado. La designación kanji suplementaria se fija en ESC $ (D

X Kanji es designado por:
B ESC $ B(JIS X0208-1983)
@ ESC $ @(JIS X0208-1978)
+ ESC y @ ESC $ B(JIS X0212-1990)
Y Alfa numérico se designa por:
B ESC (B(ASCII)
J ESC (J(JIS romano; JIS X0201)
H ESC (H(Sueco; muy desaprobado)

-v envía el resultado de la detección de codificación de entrada a stderr.

-x Modo de extensión. Mediante la detección automática de codificaciones de entrada, reconozca las definidas por el usuario
caracteres y región de caracteres extendida (fuera del rango de EUC, medio ancho indefinido
kana, carácter de control, área C1 y / o región de carácter extendido Shift C1 JIS).
La distinción entre DEC y EUC se realiza en este modo.

-z Modo de encogimiento. No reconoce kana de ancho medio (excepto JIS de 7 bits) con codificación de entrada
detección. Con esta opción, la precisión de la detección automática de las codificaciones de entrada se vuelve
mucho mejor para archivos sin kana de ancho medio.

-h Normalmente, cuando se convierte kana de ancho medio a DEC, se convierte en Katakana de ancho completo.
Con esta opción, se convierte en Hiragana.

-n caracteres definidos por el usuario, caracteres extendidos y caracteres kanji suplementarios
se convierten al cuadro blanco de ancho completo, y la región indefinida de kana de ancho medio son
convertido a punto centrado en la mitad de ancho.

-b tamaño buf
especificar el tamaño del búfer. 8 kbytes es el valor predeterminado.

-c no convierta, pero compruebe la codificación de entrada e imprima el resultado en la salida estándar. Diferente con
detección automática normal, se comprueba todo el contenido del archivo. Sin embargo cuando
Se encuentra inconsistencia de codificaciones, abortar la lectura e imprimir "datos". Opciones
excepto -x¡¤-z se ignoran

EJEMPLOS


% kcc -e presentar
La codificación de entrada se detecta automáticamente y la salida está en codificación EUC.

% kcc -sj file1 file2
Dos archivos en Shift JIS concatenado con la conversión a JIS.

% comando | kcc -k + J
salida de comando se encuentran las convertido a JIS (JIS JIS X0208 JIS JIS Roman¡¤ESC (yo Medio ancho
Kana JIS)

% kcc -c presentar
Codificación de contenidos de presentar se detecta (sin conversión)

INSECTO


La detección automática de la codificación de entrada está bien hecha para el caso normal, sin embargo, tiene la
siguientes problemas.

El JIS de 7 bits se reconoce mediante una secuencia de escape en ciertos casos. EUC y DEC son iguales (referenciados
como serie EUC). El kana de ancho medio de JIS de 8 bits es lo mismo que el kana de ancho medio de Shift JIS
(denominado serie Shift JIS). Sin embargo, la serie EUC y JIS, ambas de 8 bits
codificación, comparten las mismas regiones ampliamente. Entonces, el problema en la detección automática es
detección de estas 2 codificaciones.

La detección de la serie EUC / Shift JIS se realiza en línea por línea, cuando se encuentra que
no es la serie Shift JIS, o no es la serie EUC, la codificación está determinada. Cuando
Si se encuentra una inconsistencia, se tratará como "datos" y el contenido de la salida no se
garantizado

Si bien se determina entre la serie EUC / la serie Shift JIS después de encontrar el código de 8 bits, las conversiones
están pendientes y colocan los datos de entrada en el búfer, sin embargo, el búfer está lleno, se asume que es EUC
series y fuerzas para iniciar la conversión. Razón fundamental. Por lo general, podemos asumir que los documentos
con kanji incluyen JIS non-kanji o JIS primer estándar, se puede detectar en cierto si
es Shift JIS, que no comparte región con EUC. Entonces, si no se puede determinar,
es muy probable que sea EUC.

JIS de 8 bits y siempre tiene un número par de secuencias kana de ancho medio, entonces será
detectado erróneamente como kanji EUC. Sea celestial.

Si la codificación de entrada no tiene kana de ancho medio, use -z y la precisión de la detección se vuelve
mucho mejor. Esto se debe a que la región compartida está restringida al área del segundo JIS
normas

Región extendida de Shift JIS área definida por el usuario de EUC, caracteres de control C1 de EUC,
La región indefinida de kana de ancho medio de EUC está fuera del rango de detección automática, por lo que
no detecta codificaciones si la entrada tiene estos caracteres. Usar -x opción para especificar
modo extendido, o especifique el código de entrada.

Use kcc en línea usando los servicios de onworks.net


Ad


Ad