EnglischFranzösischSpanisch

Ad


OnWorks-Favicon

kcc - Online in der Cloud

Führen Sie kcc im kostenlosen OnWorks-Hosting-Provider über Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator aus

Dies ist der Befehl kcc, der im kostenlosen OnWorks-Hosting-Provider über eine unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


kcc - Kanji-Codeumwandler mit automatischer Codierungserkennung

ZUSAMMENFASSUNG


kcc [ -IOchnvxz ] [ -b Puffergröße ] [ Datei ] ... ...

BESCHREIBUNG


kcc ist ein Filter, der liest Datei Konvertiert sequentiell Kanji-Kodierungen und -Ausgabe in
stdout. Wenn keine Datei angegeben oder angegeben ist - als Dateiname wird von stdin gelesen. Du kannst
Geben Sie Kanji-Codierungen für die Eingabe/Ausgabe an. Jedoch, kcc Eingabecodierung automatisch erkennen,
wenn Sie keine Eingabecodierung angeben.

Verfügbare Kanji-Kodierungen sind JIS (7 Bit und/oder 8 Bit), Shift JISEUCDEC. Für Eingabe
Codierung können Sie mischen, wenn es sich um ein Paar aus EUC DEC oder Shift JIS und 7 Bit JIS handelt.
SI/SOESC(I werden als halbe Breite von JIS erkannt.

OPTIONAL


-O
-IO I für Eingabe-Kanji-Codierung¡¤O für Ausgabe-Kanji-Codierung. Wenn keine Eingabekodierung
angegeben, wird es automatisch erkannt, und wenn nicht beide Eingaben/Ausgaben sind
angegeben, ist die Ausgabecodierung 7-Bit-JIS.

Sie können eine der folgenden Optionen für die Eingabecodierungsoption angeben: I.

e EUC (verfügbar mit 7-Bit-JIS)
d DEC (verfügbar mit 7-Bit-JIS)
s JIS verschieben (verfügbar mit 7-Bit-JIS)
j7 or k
7-Bit-JIS
8 8-Bit-JIS

Sie können eine der folgenden Optionen für die Ausgabecodierungsoption angeben: O.

e EUC
d Dezember
s JIS verschieben
jXY or 7XY
7-Bit-JIS (mitSI/SO für JIS-Kana-Bezeichnung)
kXY 7-Bit-JIS (mitESC (I für JIS-Kana-Bezeichnung)
8XY 8-Bit-JIS

By XY in O Option können Sie angeben, welche Escape-Sequenz bei der JIS-Codierung verwendet wird. BJ
ist Standard. Zusätzliche Kanji-Bezeichnung ist fixiert auf ESC$(D

X Kanji wird bezeichnet durch:
B ESC$B(JIS X0208-1983)
@ ESC$@(JIS X0208-1978)
+ ESC&@ESC$B(JIS X0212-1990)
Y Alphanumerisch wird bezeichnet durch:
B ESC (B(ASCII)
J ESC(J(JIS Roman; JIS X0201)
H ESC (H(Schwedisch; stark veraltet)

-v gibt das Ergebnis der Erkennung der Eingabecodierung an stderr aus.

-x Erweiterungsmodus. Durch automatische Erkennung von Eingabecodierungen erkennen Sie benutzerdefinierte
Zeichen und erweiterter Zeichenbereich (außerhalb des EUC-Bereichs, undefinierte Halbwertsbreite)
Kana, Steuerzeichen, C1-Bereich und/oder erweiterter Zeichenbereich Shift C1 JIS ).
In diesem Modus wird zwischen DEC und EUC unterschieden.

-z Schrumpfmodus. Erkenne kein Kana mit halber Breite (außer 7-Bit-JIS) mit Eingabecodierung
Erkennung. Mit dieser Option wird die Genauigkeit der automatischen Erkennung von Eingabecodierungen
viel besser für Datei ohne Halfwidth-Kana.

-h Normalerweise, wenn Halbbreiten-Kana in DEC umgewandelt wird, wird es zu Vollbreiten-Kana.
Mit dieser Option wird es zu Hiragana.

-n benutzerdefinierte Zeichen, erweiterte Zeichen und zusätzliche Kanji-Zeichen
werden in eine weiße Box mit voller Breite umgewandelt, und ein undefinierter Bereich von Kana mit halber Breite ist
in einen zentrierten Punkt halber Breite umgewandelt.

-b Puffergröße
Puffergröße angeben. 8kbytes ist Standard.

-c Konvertieren Sie nicht, sondern überprüfen Sie die Eingabecodierung und geben Sie das Ergebnis auf stdout aus. Anders mit
normale automatische Erkennung, der gesamte Inhalt der Datei wird überprüft. Wenn jedoch
Inkonsistenz der Kodierungen gefunden, das Lesen abbrechen und "Daten" ausgeben. Optionen
ausgeschlossen -x¤-z werden ignoriert.

Beispiele:


% kcc -e Datei
Die Eingabekodierung wird automatisch erkannt und die Ausgabe erfolgt in EUC-Kodierung.

% kcc -sj file1 file2
Zwei Dateien in Shift JIS, die mit der Konvertierung in JIS verbunden sind.

% Befehl | kcc -k+J
Ausgabe von Befehl sind umgewandelt zu JIS (JIS JIS X0208 JIS JIS Roman¡¤ESC (I Halbe Breite
Kana JIS)

% kcc -c Datei
Kodierung des Inhalts von Datei wird erkannt (keine Konvertierung)

FEHLER


Die automatische Erkennung der Eingabekodierung ist für den Normalfall gut gelungen, hat jedoch die
folgenden Problemen.

7-Bit-JIS wird in bestimmten Fällen durch eine Escape-Sequenz erkannt. EUC und DEC sind gleich (siehe
als EUC-Reihe). Kana halber Breite von 8-Bit-JIS ist dasselbe wie Kana halber Breite von Shift JIS
(bezeichnet als Shift JIS-Serie). Allerdings EUC-Serie und JIS , die beide 8 Bit sind
Codierung, teilen sich weitgehend dieselben Regionen. Das Problem bei der automatischen Erkennung ist also
Erkennung dieser 2 Kodierungen.

Die Erkennung der EUC-Serie/Shift-JIS-Serie erfolgt zeilenweise, wenn festgestellt wird, dass
es sich nicht um die Shift JIS-Serie oder nicht um die EUC-Serie handelt, wird die Codierung bestimmt. Wann
Inkonsistenz gefunden, wird es als "Daten" behandelt und der Inhalt der Ausgabe nicht
garantiert.

Während zwischen EUC-Serie/Shift-JIS-Serie bestimmt, nachdem 8-Bit-Code gefunden wurde, Konvertierungen
stehen an und legen Eingabedaten in den Puffer, aber der Puffer ist voll, er geht davon aus, dass es sich um EUC handelt
Reihe und zwingt, die Konvertierung zu starten. Begründung. Normalerweise können wir davon ausgehen, dass Dokumente
mit Kanji enthalten JIS Nicht-Kanji oder JIS erster Standard, es kann in bestimmten Fällen erkannt werden
es ist Shift JIS , das keine Region mit EUC teilt. Wenn es also nicht bestimmt werden kann,
es ist sehr wahrscheinlich EUC.

8-Bit-JIS und es hat immer eine gerade Anzahl von Kana-Sequenzen mit halber Breite, dann wird es sein
fälschlicherweise als EUC-Kanji erkannt. Seien Sie sicher.

Wenn die Eingabecodierung kein Kana mit halber Breite hat, verwenden Sie -z und Genauigkeit der Erkennung werden
viel besser. Dies liegt daran, dass die gemeinsam genutzte Region auf den Bereich der JIS-Sekunde beschränkt ist
Standards.

Erweiterter Bereich des benutzerdefinierten Bereichs von Shift JIS von EUC, Steuerzeichen C1 von EUC,
undefinierter Bereich der Halbwertsbreite Kana von EUC liegen außerhalb des Bereichs der automatischen Erkennung, daher wird dies der Fall sein
kann Codierungen nicht erkennen, wenn die Eingabe diese Zeichen enthält. Verwenden -x Option zu spezifizieren
erweiterten Modus oder geben Sie den Eingabecode an.

Verwenden Sie kcc online mit den onworks.net-Diensten


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad