GoGPT Best VPN GoSearch

icono de página de OnWorks

uniconv - Online en la nube

Ejecute uniconv en el proveedor de alojamiento gratuito de OnWorks a través de Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando uniconv que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


uniconv: convierte texto a formatos nativos a través de unicode

SINOPSIS


uniconv -fuera archivo de salida [ -descodificar codificación de entrada ] [ -codificar codificación de salida ] [ aporte-
presentar ] [ -todos ] [ -desdedos ] [ -tomac ] [ -desde mac ]

DESCRIPCIÓN


uniconv programa decodifica scripts con una cierta codificación los codifica con alguna otra
codificación. El scipt es una secuencia de 16,8 o 7 bits de bytes. El texto convertido se enviará a
la salida estándar, incluso en el caso de codificaciones de 16 bits, a menos que se especifique el archivo de salida
según el -fuera .

El -descodificar y -codificar las opciones son opcionales, el convertidor predeterminado es utf-8. El programa
lee los archivos auxiliares de mapas Unicode (* .my) del directorio predeterminado / usr / share / data.
Se pueden agregar codificaciones simples 1 a 1 sobre la marcha agregando un my-file o configurando su
propiedad yudit.datapath en ~ / .yudit / yudit.properties or
/usr/share/yudit/config/yudit.properties. De forma predeterminada, se busca en / usr / share / yudit / data.

Mis archivos se pueden crear con un programa llamado Los archivos se pueden convertir entre
variantes de final de línea de dos / unix / mac con -desdedos, -desde mac, -todos, -tomac opciones. los
el predeterminado (no especificado) es Unix. maquillajemapa.

CODIFICACION


Si recibió este programa a través de la distribución de Yudit, a partir de hoy puede
convertir entre las codificaciones siguientes.

UTF-8 Yudit recomienda este formato para el intercambio de información internacional. Texto ASCII
pasará intacto, mientras que otros caracteres Unicode obtendrán su octavo bit
conjunto y la longitud del código dependerá de qué tan lejos están en el
Espacio Unicode. Este es el único formato de transformación que puede codificar ambos formatos de 16 bits.
(ucs-2) y unicode de 31 bits (ucs-4).

utf-8-s
Formato utf-8 de hackers: no da un mensaje de error cuando se utiliza un par sustituto.
decodificado y puede codificar un par sustituto 'tal cual'. Este no es un recomendado
formato de codificación, aunque este formato se utiliza para codificar / decodificar datos del portapapeles, en
para preservar la entrada.

UTF-16 Aunque 16 es más grande que 8, esto sigue siendo un compromiso requerido por sistemas operativos como
Windows que no puede manejar ucs-4: esta codificación produce flujos Unicode de 16 bits.
Además de BMP, puede convertir 16 planos utilizando el área sustituta Unicode. Esta
La codificación no puede convertir nada por encima de U + 10FFFF (Plano 16). El orden de los bytes de entrada
se reconoce por los dos primeros caracteres BEM (marca de orden de bytes) U + FEFF. Este formato
se utiliza en Windows NT para documentos como archivos .txt de bloc de notas.

utf-16-ser
Convertidor big endian utf-16.

utf-16-le
Convertidor littlen endian utf-16.

UTF-7 Este es el formato recomendado para el intercambio de información internacional, cuando los
solo se puede utilizar. Solo puede manejar Unicode de 16 bits (utf-16), para ucs-4 (arriba
U + 10FFFF) debe utilizar la codificación utf-8.

iso-8859-1
Este es el formato de codificación de caracteres ISO 8859-1. También se conoce como "Latin-1".
codificación

iso-8859-2
Este es el formato de codificación de caracteres ISO 8859-2. También se conoce como "Central
Codificación europea ".

iso-8859-5
Este es el formato de codificación de caracteres ISO 8859-5. También se conoce como "cirílico".
codificación

iso-8859-7
Este es el formato de codificación de caracteres ISO 8859-7. También se conoce como "griego".
codificación

iso-8859-9
Este es el formato de codificación de caracteres ISO 8859-9. También se conoce como "turco".
codificación

koi8-r Este es el formato de codificación de caracteres KOI8-R. Se utiliza principalmente en Rusia.

cp-1251
Este es el formato de codificación de caracteres cirílicos CP1251. Se utiliza principalmente en
Microsoft Windows y algunos sitios web.

iso-2022-jp
Este es un formato de codificación de caracteres japonés. Es un formato de codificación de 7 bits.

iso-2022-jp-3
Este es un formato de codificación de caracteres japonés. Es un formato de codificación de 7 bits. Está
basado en el estándar JIS X 0213.

euc-jp Este es un formato de codificación de caracteres japonés. Es un formato de codificación de 8 bits.
Se utiliza principalmente en sistemas UNIX.

euc-jp-3
El nombre oficial es EUC-JISX0213; simplemente no pude leer esto. Este es un japonés
formato de codificación de caracteres. Es un formato de codificación de 8 bits. Se basa en JIS X
0213 estándar.

turno-jis
Este es un formato de codificación de caracteres japonés. Es un formato de codificación de 8 bits.
Se utiliza principalmente en MSDOS / Windows.

turno-jis-3
El nombre oficial es Shift_JISX0213, simplemente no pude leer esto. Esto es un
Formato de codificación de caracteres japoneses. Es un formato de codificación de 8 bits. Utilizado principalmente en
MSDOS / Windows.

iso-2022-jp
Este es un formato de codificación de caracteres japonés de 7 bits. Los mensajes de correo electrónico iso-2022-jp
se pueden decodificar / codificar están en este formato.

iso-2022-x11
Este es un formato de codificación de caracteres japonés. También se conoce como "COMPOUND_TEXT".
codificación para el sistema X Window. Este es un formato de codificación de 7 bits. Puede ser
derivado del formato ISO 2022-JP con algunas diferencias.

ksc-5601-x11
Este es un formato de codificación de caracteres coreano utilizado por la ventana X
sistema (codificación COMPOUND_TEXT) para codificar coreano (KS X 1001) y US-ASCII. Esto es un
Formato de codificación de 7 bits compatible con la especificación ISO-2022 para codificación de múltiples
juegos de caracteres. Tenga en cuenta que esto es DIFERENTE de ISO-2022-KR (definido en
IETFRFC 1557).

euc-kr Esta es una codificación multibyte de 8 bits para coreano. Codifica US-ASCII(7 bits) en
rango de un solo byte y caracteres en KS X 1001 (anteriormente KS C 5601) en doble byte
rango con MSB on(8 bits). Se usa en Unix e Internet. Versión coreana de MS-DOS,
MacOS y MS-Windows usan una variante compatible (la mayoría de los casos, idéntica) de este
codificación

johab Esta es una codificación coreana especificada en KS X 1001 (KS C 5601-1992), Anexo
3 como codificación suplementaria. Ampliamente utilizado en MS-DOS coreano hasta mediados de la década de 1990.
Puede codificar todas las sílabas Hangul (11,172) del coreano moderno, así como todas las
símbolos especiales y Hanja (ideogramas chinos utilizados en Corea) definidos en KS X 1001.

uhc Una variante de EUC-KR utilizada en coreano MS-Windows 95/98 (codificación propietaria de
Microsoft, CP949). Su repertorio de caracteres incluye todas las sílabas modernas de
Hangul, escritura coreana, así como todos los símbolos especiales y Hanja (chino
ideogramas utilizados en Corea) definidos en KS X 1001.

GB-18030
Este es un formato de codificación de caracteres chinos basado en GB 18030. Codifica el
toda la gama U + 0000..U + 10FFFF, siendo compatible con gb-2312.

gb-2312-x11
Este es un formato de codificación de caracteres chinos basado en GB 2312. Es un formato de 7 bits.
formato de codificación.

GB-2312
Este es un formato de codificación de caracteres chinos basado en GB 2312. Es un formato de 8 bits.
formato de codificación.

big-5 Este es un formato de codificación de caracteres chinos basado en la codificación BIG5. Es un
Formato de codificación de 8 bits.

hz Este es un formato de codificación de caracteres chinos basado en la codificación "Hanzi". Es un
Formato de codificación de 7 bits.

viscii Este es un formato de codificación de caracteres vietnamita.

ucs-2-ser
Esto convierte transmisiones Unicode (ucs-16) de 2 bits. El formato se encarga de big-endian
variante. Yudit no recomienda este formato.

ucs-2-le
Esto convierte transmisiones Unicode (ucs-16) de 2 bits. El formato se ocupa de los pequeños
variante endian. Yudit no recomienda este formato.

ucs-2 Esto convierte transmisiones Unicode (ucs-16) de 2 bits. Se reconoce el orden de los bytes de entrada
por los dos primeros caracteres BEM (marca de orden de bytes) U + FEFF. Yudit no recomienda
este formato.

Java Esto convierte \ uxxxx caracteres de escape. Al codificar, todos los caracteres por encima de U + 0080
se escapará con una cadena como '\ u0080'. Cuando se decodifica el mismo formato
decodificado pero, además, también se reconoce el formato utf-8, por lo que también se puede utilizar
para recuperar datos guardados accidentalmente con la codificación incorrecta. El U + 10000..U + 10FFFF
el área se convierte en sustitutos y viceversa.

java-s Esto convierte \ uxxxx caracteres de escape. Al codificar, todos los caracteres por encima de U + 0080
se escapará con una cadena como '\ u0080'. Cuando se decodifica el mismo formato
decodificado pero, además, también se reconoce el formato utf-8, por lo que también se puede utilizar
para recuperar datos guardados accidentalmente con la codificación incorrecta. Los sustitutos no son
tratado especialmente durante la conversión - por eso no es un recomendado
conversión.

Use uniconv en línea usando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

Comandos de Linux

Ad




×
Anuncio
❤ ️Compre, reserve o adquiera aquí: sin costo, ayuda a mantener los servicios gratuitos.