AnglaisFrançaisEspagnol

Ad


Icône de favori OnWorks

kcc - En ligne dans le Cloud

Exécutez kcc dans le fournisseur d'hébergement gratuit OnWorks sur Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

Il s'agit de la commande kcc qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

PROGRAMME:

Nom


kcc - Convertisseur de code Kanji avec détection automatique d'encodage

SYNOPSIS


kcc [ -IOchnvxz ] [ -b taille buf ] [ filet ]...

DESCRIPTION


kcc est un filtre qui lit filet séquentiellement, convertit les encodages kanji et la sortie en
sortie standard. Si aucun fichier n'est spécifié, ou spécifié - comme nom de fichier, il est lu à partir de stdin. Vous pouvez
spécifier les encodages kanji pour l'entrée/sortie. Cependant, kcc détecter automatiquement l'encodage d'entrée,
si vous ne spécifiez pas l'encodage d'entrée.

Les encodages kanji disponibles sont JIS (7 bits et/ou 8 bits), Shift JISEUCDEC. Pour l'entrée
l'encodage, vous pouvez mélanger lorsqu'il s'agit d'une paire de EUC DEC ou Shift JIS et 7 bits JIS.
SI/SOESC(Je suis reconnu comme demi-largeur de JIS.

OPTIONS


-O
-IO I pour l'encodage kanji d'entrée¡¤O pour l'encodage kanji de sortie. En l'absence d'encodage d'entrée
spécifié, il sera détecté automatiquement, et si les deux entrées/sorties ne sont pas
spécifié, le codage de sortie est JIS 7 bits.

Vous pouvez spécifier l'un des éléments suivants pour l'option d'encodage d'entrée, I.

e EUC (disponible avec JIS 7 bits)
d DEC (disponible avec JIS 7 bits)
s Décaler JIS (disponible avec JIS 7 bits)
j7 or k
JIS 7 bits
8 JIS 8 bits

Vous pouvez spécifier l'un des éléments suivants pour l'option d'encodage de sortie, O.

e EUC
d DÉC
s Maj JIS
jXY or 7XY
JIS 7 bits (en utilisantSI/SO pour la désignation JIS kana)
kXY JIS 7 bits (en utilisantESC (je pour la désignation JIS kana)
8XY JIS 8 bits

By XY in O option, vous pouvez spécifier la séquence d'échappement utilisée dans l'encodage JIS. BJ
est par défaut. La désignation de kanji supplémentaire est fixée à ÉCHAP$(D

X Kanji est désigné par :
B milliards de dollars ESC(JIS X0208-1983)
@ ESC$@(JIS X0208-1978)
+ ESC&@ESC$B(JIS X0212-1990)
Y L'alpha numérique est désigné par :
B ECHAP(B(ASCII)
J ECHAP(J(JIS romain ; JIS X0201)
H ECHAP(H(suédois ; fortement déconseillé)

-v renvoie le résultat de la détection de codage d'entrée à stderr.

-x Mode d'extension. Grâce à la détection automatique des encodages d'entrée, reconnaissez les paramètres définis par l'utilisateur
caractères et région de caractère étendue (hors de la plage de l'EUC, demi-largeur indéfinie
kana, caractère de contrôle, zone C1 et/ou zone de caractère étendu Shift C1 JIS ).
La distinction entre DEC et EUC se fait dans ce mode.

-z Mode rétrécissement. Ne reconnaît pas les kana demi-chasse (sauf JIS 7 bits) avec encodage d'entrée
détection. Avec cette option, la précision de la détection automatique des encodages d'entrée devient
beaucoup mieux pour le fichier sans demi-chasse kana.

-h Normalement, lorsqu'il est converti en kana demi-largeur en DEC , il devient Katakana pleine largeur.
Avec cette option, il devient Hiragana.

-n caractères définis par l'utilisateur, caractères étendus et caractères kanji supplémentaires
sont convertis en boîte blanche pleine largeur, et la région indéfinie de kana demi-largeur sont
converti en point centré à demi-largeur.

-b taille buf
spécifier la taille du tampon. 8 Ko par défaut.

-c ne pas convertir mais vérifier l'encodage d'entrée et imprimer le résultat sur stdout. Différent avec
détection automatique normale, tout le contenu du fichier est vérifié. Cependant, quand
une incohérence des encodages est trouvée, abandonner la lecture et imprimer les "données". Options
sauf -x??-z sont ignorés.

EXEMPLES


% kcc -e filet
L'encodage d'entrée est détecté automatiquement et la sortie est en codage EUC.

% kcc -sj file1 file2
Deux fichiers dans Shift JIS concaténés avec la conversion en JIS.

% commander | kcc -k+J
sortie de commander converti à JIS (JIS JIS X0208 JIS JIS Romain¡¤ESC (je Demi-largeur
Kana JIS)

% kcc -c filet
Encodage du contenu de filet est détecté (pas de conversion)

PUNAISE


La détection automatique de l'encodage d'entrée est bien faite pour le cas normal, cependant, elle a le
problèmes suivants.

JIS 7 bits est reconnu par séquence d'échappement dans certains. EUC et DEC sont les mêmes (référencés
comme série EUC). Le kana demi-largeur de JIS 8 bits est le même que le kana demi-largeur de Shift JIS
(appelée série Shift JIS). Cependant, les séries EUC et JIS, qui sont toutes deux 8 bits
l'encodage, partagent largement les mêmes régions. Ainsi, le problème de la détection automatique est
détection de ces 2 encodages.

La détection des séries EUC/Shift JIS se fait ligne par ligne, lorsqu'il est constaté que
ce n'est pas la série Shift JIS, ou ce n'est pas la série EUC, l'encodage est déterminé. Lorsque
incohérence trouvée, elle sera traitée comme des "données" et le contenu de la sortie n'est pas
garanti.

Bien que déterminé entre la série EUC/la série Shift JIS après la découverte du code 8 bits, les conversions
sont en attente et mettent les données d'entrée dans le tampon, cependant, le tampon est plein, il suppose que c'est EUC
série et force à démarrer la conversion. Raisonnement. Habituellement, nous pouvons supposer que les documents
avec kanji incluent JIS non-kanji ou JIS first standard, il peut être détecté dans certains cas
c'est Shift JIS, qui ne partage pas de région avec EUC. Donc, si cela ne peut pas être déterminé,
il est très probable que ce soit EUC.

JIS 8 bits et il a toujours un nombre pair de séquences de kana demi-largeur, alors ce sera
détecté à tort comme kanji EUC. Soyez prudent.

Si l'encodage d'entrée n'a pas de kana demi-largeur, utilisez -z et la précision de la détection deviennent
bien mieux. C'est parce que la région partagée est limitée à la zone de JIS deuxième


Région étendue de Shift JIS zone définie par l'utilisateur de l'EUC, caractères de contrôle C1 de l'EUC,
région indéfinie de demi-largeur kana de l'EUC sont hors de portée de la détection automatique, il sera donc
ne parvient pas à détecter les encodages si l'entrée a ces caractères. Utilisation -x possibilité de spécifier
mode étendu, ou spécifiez le code d'entrée.

Utiliser kcc en ligne en utilisant les services onworks.net


Serveurs et postes de travail gratuits

Télécharger des applications Windows et Linux

Commandes Linux

Ad