GoGPT Best VPN GoSearch

Icône de favori OnWorks

uniconv - En ligne dans le Cloud

Exécutez uniconv dans le fournisseur d'hébergement gratuit OnWorks sur Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

Il s'agit de la commande uniconv qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

PROGRAMME:

Nom


uniconv - convertit le texte en formats natifs via Unicode

SYNOPSIS


uniconv -en dehors fichier de sortie [ -décoder codage d'entrée ] [ -encoder codage de sortie ] [ contribution-
filet ] [ -à faire ] [ -dedos ] [ -tomac ] [ -demac ]

DESCRIPTION


uniconv le programme décode les scripts avec un certain codage les encode avec un autre
codage. Le scipt est un flux de 16,8 ou 7 bits. Le texte converti sera envoyé à
la sortie standard, même en cas d'encodages 16 bits, sauf si le fichier de sortie est spécifié
par le -en dehors option.

L' -décoder et -encoder les options sont facultatives, le convertisseur par défaut est utf-8. Le programme
lit les fichiers d'aide à la carte Unicode (*.my) à partir du répertoire par défaut /usr/share/data.
Des encodages simples 1 à 1 peuvent être ajoutés à la volée en ajoutant un fichier mon ou en définissant votre
propriété yudit.datapath dans ~/.yudit/yudit.properties or
/usr/share/yudit/config/yudit.properties. Par défaut, /usr/share/yudit/data est recherché.

Mes fichiers peuvent être créés par un programme appelé Les fichiers peuvent être convertis entre
variantes de fin de ligne dos/unix/mac avec -de dos, -demac, -à faire, -tomac option. les
par défaut (non spécifié) est Unix. maquillage.

CODAGE


Si vous avez reçu ce programme via la distribution Yudit, vous pouvez dès aujourd'hui
convertir entre les encodages ci-dessous.

utf-8 Yudit recommande ce format pour l'échange international d'informations. texte ASCII
passera intact, tandis que les autres caractères Unicode obtiendront leur 8ème bit
et la longueur du code dépendra de la distance à laquelle ils se trouvent dans le
Espace Unicode. C'est le seul format de transformation qui peut encoder à la fois 16 bits
(ucs-2) et 31 bits (ucs-4) unicode.

utf-8-s
Format Hackers utf-8 - il ne donne pas de message d'erreur lorsqu'une paire de substitution est
décodé et il peut coder une paire de substitution « en l'état ». Ce n'est pas recommandé
format de codage bien que ce format soit utilisé pour coder/décoder les données du presse-papiers, en
afin de préserver l'entrée.

utf-16 Bien que 16 soit plus grand que 8, cela reste un compromis requis par les systèmes d'exploitation comme
Windows qui ne peut pas gérer ucs-4 - cet encodage produit des flux unicode 16 bits.
En plus de BMP, il peut convertir 16 avions en utilisant la zone de substitution Unicode. Cette
l'encodage ne peut rien convertir au-dessus de U+10FFFF (Plan 16). L'ordre des octets d'entrée
est reconnu par les deux premiers caractères BEM (byte-order-mark) U+FEFF. Ce format
est utilisé dans Windows NT pour les documents tels que les fichiers .txt du bloc-notes.

utf-16-be
Convertisseur big endian utf-16.

utf-16-le
Convertisseur Littlen Endian utf-16.

utf-7 Il s'agit du format recommandé pour l'échange international d'informations, lorsque 7 bits
ne peut être utilisé que. Il ne peut gérer que l'unicode 16 bits (utf-16), pour ucs-4 (ci-dessus
U+10FFFF), vous devez utiliser l'encodage utf-8.

iso-8859-1
Il s'agit du format de codage de caractères ISO 8859-1. Il est également connu sous le nom de "Latin-1"
codage.

iso-8859-2
Il s'agit du format de codage de caractères ISO 8859-2. Elle est également connue sous le nom de « Centrale
codage européen".

iso-8859-5
Il s'agit du format de codage de caractères ISO 8859-5. Il est également connu sous le nom de "cyrillique"
codage.

iso-8859-7
Il s'agit du format de codage de caractères ISO 8859-7. On l'appelle aussi "grec"
codage.

iso-8859-9
Il s'agit du format de codage de caractères ISO 8859-9. Il est également connu sous le nom de "turc"
codage.

koi8-r Il s'agit du format d'encodage de caractères KOI8-R. Il est principalement utilisé en Russie.

CP-1251
Il s'agit du format de codage des caractères cyrilliques CP1251. Il est principalement utilisé dans
Microsoft Windows et certains sites Web.

iso-2022-jp
Il s'agit d'un format de codage de caractères japonais. Il s'agit d'un format d'encodage 7 bits.

iso-2022-jp-3
Il s'agit d'un format de codage de caractères japonais. Il s'agit d'un format d'encodage 7 bits. Il est
base sur la norme JIS X 0213.

euc-jp Il s'agit d'un format de codage de caractères japonais. Il s'agit d'un format d'encodage 8 bits.
Principalement utilisé dans les systèmes UNIX.

euc-jp-3
Le nom officiel est EUC-JISX0213 - je ne pouvais tout simplement pas lire ceci. c'est un japonais
format de codage des caractères. C'est un format d'encodage 8 bits. Il est basé sur JIS X
0213 standard.

maj-jis
Il s'agit d'un format de codage de caractères japonais. Il s'agit d'un format d'encodage 8 bits.
Principalement utilisé sous MSDOS/Windows.

shift-jis-3
Le nom officiel est Shift_JISX0213 - je ne pouvais tout simplement pas lire ceci. C'est un
Format de codage de caractères japonais. Il s'agit d'un format d'encodage 8 bits. Principalement utilisé dans
MS-DOS/Windows.

iso-2022-jp
Il s'agit d'un format de codage de caractères japonais à 7 bits. Les e-mails iso-2022-jp
peuvent être décodés/encodés sont dans ce format.

iso-2022-x11
Il s'agit d'un format de codage de caractères japonais. Il est également connu sous le nom de "COMPOUND_TEXT"
encodage pour le système X Window. Il s'agit d'un format d'encodage 7 bits. Ça peut être
dérivé du format ISO 2022-JP avec quelques différences.

ksc-5601-x11
Il s'agit d'un format de codage de caractères coréen utilisé par la fenêtre X
système (codage COMPOUND_TEXT) pour encoder le coréen (KS X 1001) et l'US-ASCII. C'est un
Format d'encodage 7 bits conforme à la spécification ISO-2022 pour l'encodage de plusieurs
jeux de caractères. Veuillez noter que ceci est DIFFÉRENT de ISO-2022-KR (défini dans
IETF RFC1557).

euc-kr Il s'agit d'un encodage multi-octets 8 bits pour le coréen. il encode US-ASCII(7 bits) dans
plage d'un seul octet et caractères dans KS X 1001 (anciennement KS C 5601) en double octet
gamme avec MSB on(8 bits). Il est utilisé sous Unix et Internet. version coréenne de MS-DOS,
MacOS et MS-Windows utilisent une variante compatible (la plupart des cas, identique) de ce
codage.

Johab Il s'agit d'un codage coréen spécifié dans KS X 1001 (KS C 5601-1992), annexe
3 comme encodage supplémentaire. Largement utilisé dans MS-DOS coréen jusqu'au milieu des années 1990.
Il peut encoder toutes les syllabes Hangul (11,172 XNUMX) du coréen moderne ainsi que tous les
symboles spéciaux et Hanja (idéogrammes chinois utilisés en Corée) définis dans KS X 1001.

euhc Une variante d'EUC-KR utilisée en coréen MS-Windows 95/98 (codage propriétaire de
Microsoft, CP949). Son répertoire de caractères comprend toutes les syllabes modernes de
Hangul, écriture coréenne ainsi que tous les symboles spéciaux et Hanja (chinois
idéogrammes utilisés en Corée) définis dans KS X 1001.

gb-18030
Il s'agit d'un format d'encodage de caractères chinois basé sur GB 18030. Il encode le
toute la gamme U+0000..U+10FFFF, tout en étant compatible avec gb-2312.

gb-2312-x11
Il s'agit d'un format de codage de caractères chinois basé sur GB 2312. Il s'agit d'un
format d'encodage.

gb-2312
Il s'agit d'un format de codage de caractères chinois basé sur GB 2312. Il s'agit d'un
format d'encodage.

big-5 Il s'agit d'un format de codage de caractères chinois basé sur le codage BIG5. C'est un
Format d'encodage 8 bits.

hz Il s'agit d'un format d'encodage de caractères chinois basé sur l'encodage "Hanzi". C'est un
Format d'encodage 7 bits.

viscères Il s'agit d'un format de codage de caractères vietnamien.

ucs-2-être
Cela convertit les flux unicode 16 bits (ucs-2). Le format s'occupe du big-endian
une variante. Yudit ne recommande pas ce format.

ucs-2-le
Cela convertit les flux unicode 16 bits (ucs-2). Le format prend soin de peu-
variante endian. Yudit ne recommande pas ce format.

ucs-2 Cela convertit les flux unicode 16 bits (ucs-2). L'ordre des octets d'entrée est reconnu
par les deux premiers caractères BEM (byte-order-mark) U+FEFF. Yudit ne recommande pas
ce format.

Java Cela convertit les échappements de caractères \uxxxx. Lors de l'encodage, tous les caractères supérieurs à U+0080
sera échappé avec une chaîne comme '\u0080'. Lors du décodage, le même format est
décodé mais, en plus, le format utf-8 est également reconnu, il peut donc aussi être utilisé
pour récupérer des données accidentellement enregistrées avec le mauvais enconding. Le U+10000..U+10FFFF
zone est convertie en substituts et vice versa.

java-s Cela convertit les échappements de caractères \uxxxx. Lors de l'encodage, tous les caractères supérieurs à U+0080
sera échappé avec une chaîne comme '\u0080'. Lors du décodage, le même format est
décodé mais, en plus, le format utf-8 est également reconnu, il peut donc aussi être utilisé
pour récupérer des données accidentellement enregistrées avec le mauvais enconding. Les mères porteuses ne sont pas
traité spécialement lors de la conversion - c'est pourquoi il n'est pas recommandé
la conversion.

Utilisez uniconv en ligne à l'aide des services onworks.net


Serveurs et postes de travail gratuits

Télécharger des applications Windows et Linux

Commandes Linux

Ad




×
Publicité
❤ ️Achetez, réservez ou achetez ici — gratuitement, contribue à maintenir la gratuité des services.