Il s'agit de la commande mbconv qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
mbconv - Convertisseur de schéma de codage de caractères
SYNOPSIS
mbconv [options] ...
DESCRIPTION
Il s'agit d'une application d'une bibliothèque pour gérer l'encodage de caractères sur plusieurs octets :
http://pub.ks-and-ks.ne.jp/prog/libmoe/
principalement écrit pour le débogage de la bibliothèque.
Il lit octet par octet à partir de fichiers donnés en ligne de commande (ou d'entrée standard si aucun fichier n'est
spécifié), convertit le schéma de codage de caractères (CES) tel que spécifié par les options de ligne de commande
(décrit ci-dessous) et la sortie vers la sortie standard (ou un fichier spécifié par -t Option ou -a
option).
Options
-?, -h, --Aidez-moi
afficher le résumé des options et des sorties.
-a filet, --ajouter à=filet
la sortie est ajoutée à filet.
-c convertisseurs, --convertir en=convertisseurs
spécifie la conversion de codage de caractères. convertisseurs doit être une liste séparée par des virgules de
mots décrits dans les « spécificateurs de conversion ».
-f drapeaux, --drapeau=drapeaux
spécifie des drapeaux pour changer le comportement de la conversion. drapeaux doit être une liste séparée par des virgules
de mots décrits dans les « spécificateurs de drapeau ».
-i, --saisir
les options suivantes s'appliquent au flux d'entrée.
-m un magnifique, --mime-charset=un magnifique
un codage mime conforme à la RFC2047 est effectué. est utilisé comme nom de jeu de caractères.
-n, --numéro de ligne
le numéro de ligne (>= 1) est inséré au début de chaque ligne.
-o, --output
les options suivantes s'appliquent au flux de sortie.
-t filet, --à=filet
sortie dans un fichier (tronqué).
-w, --largeur
largeur de sortie de chaque ligne.
-cs , --jeu de caractères=un magnifique
spécifie le nom du jeu de caractères. Certaines spécifications linguistiques sont également acceptées ainsi que
Les noms de jeu de caractères MIME, qui sont utilisés pour restreindre les candidats du schéma de codage d'entrée
flux. Les langues acceptables sont répertoriées dans « Langues acceptables ».
--format=un magnifique
spécifie le format de sortie
--lequel
nom du jeu de caractères de sortie de chaque flux d'entrée vers stderr, sous la forme
filet prénom":" jeu de caractères prénom
si deux fichiers ou plus sont spécifiés sur la ligne de commande, ou
jeu de caractères prénom
autrement.
--expression régulière=Standard expression
spécifie l'expression régulière pour filtrer la sortie. Encodage de caractères de Standard
expression peut être spécifié en mettant une chaîne de la forme
"*"jeu de caractères prénom"*"
au début de l'expression régulière, sinon UTF-8. Encodage de caractères de
l'expression est convertie en celle du flux de sortie avant la correspondance.
Conversion spécificateurs
La conversion est appliquée juste avant que chaque caractère ne soit transmis au flux. La configuration de la conversion est
effectué automatiquement sur la base du CES. Donc, dans la plupart des cas, vous n'avez pas besoin de spécifier de convertisseurs
explicitement.
ascii
ASCII domestique converti en US-ASCII,
CES converti de manière appropriée selon le CES lié au flux d'entrée/sortie,
à-ucs
converti en Unicode,
f2h, plein à moitié
Les caractères de compatibilité pleine largeur sont convertis en caractères demi-largeur correspondants,
h2f, à moitié plein
Les caractères de compatibilité demi-chasse sont convertis en caractères pleine chasse correspondants,
jisx0213
Les points de code dans JIS C 6226 ou JIS X 0208 qui ne sont liés à aucun caractère sont
converti en avion JIS X 0213 1,
jisx0213-agressif
Tous les points de code dans JIS C 6226 ou dans JIS X 0208 sont convertis en JIS X 0213 plan 1,
ms-latin1
Les caractères Unicode du point de code entre 0x80 et 0x9F (tous deux inclus) sont convertis
à d'autres caractères Unicode comme s'il s'agissait de caractères de ces points de code dans Microsoft
Page de codes Windows 1252.
ucs-à-jis0208-extra, jis0208-à-ucs-extra
Les convertisseurs entre certains caractères JIS X 0208 et Unicode ayant des glyphes similaires (par
la courtoisie d'Ambrose Li[email protected]>).
Drapeau spécificateurs
use-0x28-for-94x94inG0, 28
utilisez "1/11 2/4 2/8 F" au lieu de "1/11 2/4 F" pour désigner les jeux de caractères avec l'octet final
4/0, 4/1 ou 4/2 à G0,
ac, ascii-au-contrôle
la séquence d'échappement "1/11 2/8 4/2" est sortie avant chaque caractère de contrôle,
nossl, ignorer-7bit-single-shift
la séquence d'échappement pour un décalage unique de 7 bits est ignorée,
dnc, jeter-non-préféré-char
supprimer les caractères que le CES lié au flux de sortie ne peut pas décoder.
Acceptable langues
Les mots suivants peuvent être donnés à la place du nom du jeu de caractères MIME pour le flux d'entrée. Dans ce
cas, le schéma de codage est automatiquement détecté (espérons-le) parmi les suivants.
c, cn, Chine, chinois
x-gb-18030-2000, cn-big5, utf-8 ou x-euc-tw.
j, ja, jp, Japon, Japonais
euc-jp, shift_jis ou utf-8.
k, ko, kr, Corée, coréen
euc-kr, x-johab, utf-8 ou x-unified-hangul.
CJK iso-8859-1, x-gb-18030-2000, cn-big5, x-euc-tw, euc-jp, shift_jis, euc-kr, x-johab,
x-unified-hangul, ou utf-8.
Utiliser mbconv en ligne à l'aide des services onworks.net