Este es el comando mbconv que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
mbconv - Conversor de esquemas de codificación de caracteres
SINOPSIS
mbconv [opciones] ...
DESCRIPCIÓN
Esta es una aplicación de una biblioteca para manejar la codificación de caracteres de múltiples octetos:
http://pub.ks-and-ks.ne.jp/prog/libmoe/
escrito principalmente para depurar la biblioteca.
Lee octeto por octeto de archivos dados en la línea de comando (o entrada estándar si no hay ningún archivo
especificado), convierte el esquema de codificación de caracteres (CES) según lo especificado por las opciones de la línea de comandos
(descrito a continuación) y salida a salida estándar (o un archivo especificado por -t Opción o -a
opción).
Opciones
-?, -h, --ayuda
muestra un resumen de opciones y salidas.
-a presentar, --añadir a=presentar
la salida se adjunta a presentar.
-c convertidores, --convertir a=convertidores
especifica la conversión de codificación de caracteres. convertidores debe ser una lista separada por comas de
palabras descritas en "Especificadores de conversión".
-f banderas, --bandera=banderas
especifica banderas para cambiar el comportamiento de conversión. banderas debe ser una lista separada por comas
de palabras se describen en "Indicadores de bandera".
-i, --aporte
las opciones siguientes se aplican al flujo de entrada.
-m cadena, - juego de caracteres de mimo=cadena
Se realiza la codificación mime conforme a RFC2047. se utiliza como nombre del juego de caracteres.
-n, --número de línea
El número de línea (> = 1) se inserta al principio de cada línea.
-o, --producción
las opciones siguientes se aplican al flujo de salida.
-t presentar, --a=presentar
salida a archivo (truncado).
-w, --ancho
ancho de salida de cada línea.
-cs , --juego de caracteres=cadena
especifica el nombre del juego de caracteres. También se aceptan algunas especificaciones de idioma, así como
Nombres de conjuntos de caracteres MIME, que se utilizan para restringir candidatos del esquema de codificación de entrada
Arroyo. Los idiomas aceptables se enumeran en "Idiomas aceptables".
--formato=cadena
especifica el formato de salida
--cual
nombre del juego de caracteres de salida de cada flujo de entrada a stderr, en la forma
presentar nombre "" charset nombre
si se especifican dos o más archivos en la línea de comando, o
charset nombre
de otra manera.
--expresión regular=regular expresión
especifica una expresión regular para filtrar la salida. Codificación de caracteres de regular
expresión se puede especificar poniendo una cadena de la forma
"*"charset nombre "*"
al principio de la expresión regular, de lo contrario UTF-8. Codificación de caracteres de
la expresión se convierte a la del flujo de salida antes de coincidir.
Conversión especificadores
La conversión se aplica justo antes de que cada carácter se envíe a la transmisión. La configuración de conversión es
realizado automáticamente en base a CES. Por tanto, en la mayoría de los casos, no es necesario especificar convertidores
explícitamente
ascii
ASCII doméstico convertido a US-ASCII,
CES convertido apropiadamente de acuerdo con el CES vinculado al flujo de entrada / salida,
to-ucs
convertido a Unicode,
f2h, completo a la mitad
Los caracteres de compatibilidad de ancho completo se convierten en los correspondientes de medio ancho,
h2f, medio lleno
Los caracteres de compatibilidad de ancho medio se convierten en los correspondientes de ancho completo,
jisx0213
Los puntos de código en JIS C 6226 o en JIS X 0208 que no están vinculados a ningún carácter son
convertido en JIS X 0213 plano 1,
jisx0213-agresivo
Todos los puntos de código en JIS C 6226 o en JIS X 0208 se convierten en el plano 0213 de JIS X 1,
ms-latin1
Los caracteres Unicode del punto de código entre 0x80 y 0x9F (ambos inclusive) se convierten
a otros caracteres Unicode como si fueran caracteres de esos puntos de código en Microsoft
Página de códigos de Windows 1252.
ucs-a-jis0208-extra, jis0208-a-ucs-extra
Convertidores entre algunos caracteres JIS X 0208 y Unicode que tienen glifos similares (por
la cortesía de Ambrose Li[email protected]>).
Destacar especificadores
use-0x28-for-94x94inG0, 28
use "1/11 2/4 2/8 F" en lugar de "1/11 2/4 F" para designar juegos de caracteres con octeto final
4/0, 4/1 o 4/2 a G0,
ac, ascii-en-control
La secuencia de escape "1/11 2/8 4/2" se emite antes de cada carácter de control,
nossl, ignorar-7 bits-turno único
Se ignora la secuencia de escape para un solo turno de 7 bits,
dnc, descartar-no-preferido-char
descartar los caracteres que CES vinculado al flujo de salida no puede decodificar.
Aceptable idiomas
Es posible que se proporcionen las siguientes palabras en lugar del nombre del juego de caracteres MIME para el flujo de entrada. En eso
En este caso, el esquema de codificación se detecta automáticamente (con suerte) entre los siguientes.
c, cn, China, chino
x-gb-18030-2000, cn-big5, utf-8 o x-euc-tw.
j, ja, jp, Japón, japonés
euc-jp, shift_jis o utf-8.
k, ko, kr, Corea, coreano
euc-kr, x-johab, utf-8 o x-unified-hangul.
cjk iso-8859-1, x-gb-18030-2000, cn-big5, x-euc-tw, euc-jp, shift_jis, euc-kr, x-johab,
x-unified-hangul o utf-8.
Utilice mbconv en línea utilizando los servicios de onworks.net