英語フランス語スペイン語

Ad


OnWorksファビコン

kcc-クラウドでのオンライン

Ubuntu Online、Fedora Online、Windowsオンラインエミュレーター、またはMACOSオンラインエミュレーターを介してOnWorks無料ホスティングプロバイダーでkccを実行します

これは、Ubuntu Online、Fedora Online、Windowsオンラインエミュレーター、MACOSオンラインエミュレーターなどの複数の無料オンラインワークステーションのXNUMXつを使用してOnWorks無料ホスティングプロバイダーで実行できるコマンドkccです。

プログラム:

NAME


kcc-自動検出をエンコードする漢字コードカバーター

SYNOPSIS


kcc [ -IOchnvxz ] [ -b バフサイズ ] [ file ]..。

DESCRIPTION


kcc 読み取ります file 続いて、漢字エンコーディングと出力をに変換します
stdout。 ファイルが指定されていない、または指定されている場合 - ファイル名として、stdinから読み取ります。 あなたはできる
入出力の漢字エンコーディングを指定します。 しかし、 kcc 入力encodigを自動的に検出し、
入力エンコーディングを指定しない場合。

利用可能な漢字エンコーディングは、JIS(7ビットおよび/または8ビット)、ShiftJISEUCDECです。 入力用
エンコーディングでは、これらがEUCDECまたはShiftJISと7ビットJISのいずれかのペアである場合に混合できます。
SI/SOESC(IはJISの半値幅として認識されます。

OPTIONS


-O
-IO I 入力漢字エンコーディング用¡¤O 出力漢字エンコーディング用。 入力エンコーディングがない場合
指定すると、自動的に検出され、入出力の両方が検出されない場合
指定された出力エンコーディングは7ビットJISです。

入力エンコーディングオプションには、次のいずれかを指定できます。 I.

e EUC(7ビットJISで利用可能)
d DEC(7ビットJISで利用可能)
s シフトJIS(7ビットJISで利用可能)
j7 or k
7ビットJIS
8 8ビットJIS

出力エンコーディングオプションには、次のいずれかを指定できます。 O.

e EUC
d 12月
s シフトJIS
jXY or 7XY
7ビットJIS(使用SI/SO JIS仮名指定の場合)
kXY 7ビットJIS(使用ESC(I JIS仮名指定の場合)
8XY 8ビットJIS

By XY in O オプション、JISエンコーディングで使用するエスケープシーケンスを指定できます。 BJ
デフォルトです。 補足漢字指定はに固定されています ESC $(D

X 漢字は次のように指定されます。
B ESC $ B(JIS X0208-1983)
@ ESC $ @(JIS X0208-1978)
+ ESC&@ ESC $ B(JIS X0212-1990)
Y AlphaNumericalは次のように指定されます。
B ESC(B(ASCII)
J ESC(J(JISローマン; JIS X0201)
H ESC(H(スウェーデン語;非推奨)

-v 入力エンコーディング検出の結果をstderrに出力します。

-x 拡張モード。 入力エンコーディングの自動検出により、ユーザー定義を認識します
文字および拡張文字領域(EUCの範囲外、未定義の半値幅
かな、制御文字、C1領域、および/または拡張文字領域Shift C1 JIS)。
DECとEUCの区別は、このモードで行われます。

-z シュリンクモード。 入力エンコーディングで半角カナ(7ビットJISを除く)を認識しない
検出。 このオプションを使用すると、入力エンコーディングの自動検出の精度は次のようになります。
半角かなのないファイルの方がはるかに優れています。

-h 通常、半値カナをDECに変換すると、全角カタカナになります。
このオプションを使用すると、ひらがなになります。

-n ユーザー定義文字、拡張文字、および補助漢字
全角ホワイトボックスに変換され、半値カナの未定義領域は
半値全角形のドットに変換されます。

-b バフサイズ
バッファサイズを指定します。 デフォルトは8kバイトです。

-c 変換せずに、入力エンコーディングを確認し、結果をstdoutに出力します。 とは異なります
通常の自動検出では、ファイルの内容全体がチェックされます。 ただし、
エンコーディングの不整合が見つかりました。読み取りを中止して「データ」を出力してください。 オプション
以下は除く -x¤-z 無視されます。


% kcc -e file
入力エンコーディングは自動的に検出され、出力はEUCエンコーディングになります。

% kcc -sj file1 file2
JISへの変換に連結されたShiftJISのXNUMXつのファイル。

% command | kcc -k + J
の出力 command   変換 〜へ JIS(JIS JIS X0208JISJISローマン¡¤ESC(I 半角形
かなJIS)

% kcc -c file
の内容のエンコーディング file 検出された(変換なし)

バグ


入力エンコーディングの自動検出は通常の場合にうまく行われますが、
以下の問題。

7ビットJISはエスケープシーケンスで認識される場合があります。 EUCとDECは同じです(参照
EUCシリーズとして)。 8ビットJISの半値カナはShiftJISの半角カナと同じです。
(シフトJISシリーズと呼ばれます)。 ただし、EUCシリーズとJISはどちらも8ビットです。
エンコーディングは、同じ地域を広く共有しています。 したがって、自動検出の問題は
これらの2つのエンコーディングの検出。

EUCシリーズ/ ShiftJISシリーズの検出はXNUMX行ずつ行います。
Shift JISシリーズではない、またはEUCシリーズではない、エンコーディングが決定されます。 いつ
不整合が見つかった場合、それは「データ」として扱われ、出力の内容は
保証されています。

8ビットコードが見つかった後、EUCシリーズ/シフトJISシリーズ間で決定されますが、変換
保留中で入力データをバッファに入れますが、バッファがいっぱいで、EUCであると想定します
シリーズと強制的に変換を開始します。 理論的根拠。 通常、私たちはその文書を仮定することができます
漢字にはJIS非漢字またはJIS第一規格が含まれているので、次の場合に確実に検出できます。
EUCと地域を共有していないShiftJISです。 したがって、それを決定できない場合は、
EUCである可能性が非常に高いです。

8ビットJISであり、常に偶数の英数字シーケンスがある場合、次のようになります。
EUC漢字として誤って検出されました。 セラフルになりましょう。

入力エンコーディングに半角かながない場合は、 -z と検出の精度は
ずっといい。 これは、共有領域がJIS秒の領域に制限されているためです。
標準。

EUCのShiftJISユーザー定義領域の拡張領域、EUCの制御文字C1、
EUCの半値カナの未定義領域は自動検出の範囲外であるため、
入力にこれらの文字が含まれている場合、エンコーディングの検出に失敗します。 使用する -x 指定するオプション
拡張モード、または入力コードを指定します。

onworks.netサービスを使用してオンラインでkccを使用する


無料のサーバーとワークステーション

Windows と Linux のアプリをダウンロード

Linuxコマンド

Ad