kcc - Online in de cloud

Dit is de opdracht kcc die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

PROGRAMMA:

NAAM


kcc - Kanji-codecoverter met automatische coderingsdetectie

KORTE INHOUD


kcc [ -IOchnvxz ] [ -b grote maat ] [ filet

PRODUCTBESCHRIJVING


kcc is een filter dat leest filet converteert opeenvolgend kanji-coderingen en uitvoer naar
stoer. Als er geen bestand is opgegeven of opgegeven - als bestandsnaam wordt gelezen uit stdin. Jij kan
specificeer kanji-coderingen voor invoer/uitvoer. Echter, kcc detecteer invoer automatisch coderen,
als u geen invoercodering opgeeft.

Beschikbare kanji-coderingen zijn JIS (7 bit en/of 8 bit), Shift JISEUCDEC. Voor invoer
codering, je kunt mixen als deze een paar zijn van EUC DEC of Shift JIS en 7 bit JIS.
SI/SOESC(I wordt herkend als halve breedte van JIS.

OPTIES


-O
-IO I voor invoer kanji-codering¡¤O voor uitvoerkanji-codering. Wanneer er geen invoercodering is
opgegeven, wordt het automatisch gedetecteerd, en als zowel de invoer als de uitvoer dat niet zijn
gespecificeerd, is de uitvoercodering 7 bit JIS.

U kunt een van de volgende opties opgeven voor de invoercoderingsoptie: I.

e EUC (beschikbaar met 7-bits JIS)
d DEC (beschikbaar met 7 bit JIS)
s Shift JIS (beschikbaar met 7-bits JIS)
j7 or k
7-bits JIS
8 8-bits JIS

U kunt een van de volgende opties opgeven voor de uitvoercoderingsoptie: O.

e EUC
d December
s Verschuif JIS
jXY or 7XY
7-bits JIS (met behulp vanSI/SO voor JIS kana-aanduiding)
kXY 7-bits JIS (met behulp vanESC(ik voor JIS kana-aanduiding)
8XY 8-bits JIS

By XY in O optie kunt u opgeven welke escape-reeks wordt gebruikt in JIS-codering. BJ
is standaard. Aanvullende kanji-aanduiding is vastgesteld op ESC $ (D

X Kanji wordt aangeduid door:
B ESC$B(JIS X0208-1983)
@ ESC$@(JIS X0208-1978)
+ ESC&@ESC$B(JIS X0212-1990)
Y Alfanumeriek wordt aangeduid met:
B ESC(B(ASCII)
J ESC(J(JIS Romeins; JIS X0201)
H ESC(H(Zweeds; sterk verouderd)

-v voert het resultaat van invoercoderingsdetectie uit naar stderr.

-x Extensiemodus. Door automatische detectie van invoercoderingen herkent u door de gebruiker gedefinieerde coderingen
tekens en uitgebreid tekengebied (buiten bereik van EUC, ongedefinieerde halve breedte
kana, controleteken, C1-gebied en/of uitgebreid tekengebied Shift C1 JIS ).
In deze modus wordt onderscheid gemaakt tussen DEC en EUC.

-z Verkleinmodus. Herkent geen halve breedte kana (behalve 7 bit JIS ) met invoercodering
detectie. Met deze optie wordt de nauwkeurigheid van de automatische detectie van invoercoderingen vergroot
veel beter voor bestanden zonder kana met halve breedte.

-h Normaal gesproken wordt het, wanneer het kana van halve breedte naar DEC wordt geconverteerd, Katakana van volledige breedte.
Met deze optie wordt het Hiragana.

-n door de gebruiker gedefinieerde tekens, uitgebreide tekens en aanvullende kanji-tekens
worden geconverteerd naar een witte doos met volledige breedte, en een ongedefinieerd gebied met halve breedte kana
geconverteerd naar een gecentreerde punt met halve breedte.

-b grote maat
buffergrootte opgeven. 8 kbytes is standaard.

-c converteer niet, maar controleer de invoercodering en druk het resultaat af naar stdout. Anders met
normale automatische detectie, de volledige inhoud van het bestand wordt gecontroleerd. Echter, wanneer
Als er inconsistentie van de coderingen wordt gevonden, breekt u het lezen af ​​en drukt u de "gegevens" af. Opties
behalve -x¡¤-z worden genegeerd.

Voorbeelden


% kcc -e filet
Invoercodering wordt automatisch gedetecteerd en de uitvoer is in EUC-codering.

% kcc -sj file1 file2
Twee bestanden in Shift JIS samengevoegd met conversie naar JIS.

% commando | kcc -k+J
output van commando zijn geconverteerd naar JIS(JIS JIS X0208 JIS JIS Roman¡¤ESC(ik Halve breedte
Kana JIS)

% kcc -c filet
Codering van de inhoud van filet is gedetecteerd (geen conversie)

BUG


Automatische detectie van invoercodering is in normale gevallen goed gedaan, maar het heeft de
volgende problemen.

7-bits JIS wordt in bepaalde gevallen herkend door een ontsnappingsreeks. EUC en DEC zijn hetzelfde (referentie
als EUC-serie). Kana met halve breedte van 8 bit JIS is hetzelfde als kana met halve breedte van Shift JIS
(aangeduid als Shift JIS-serie). Echter, EUC-serie en JIS, die beide 8 bit zijn
codering, delen dezelfde regio's op grote schaal. Het probleem bij automatische detectie is dus
detectie van deze 2 coderingen.

Detectie van EUC-series/Shift JIS-series gebeurt regel voor regel, wanneer blijkt dat dit het geval is
het is geen Shift JIS-serie, of het is geen EUC-serie, de codering is bepaald. Wanneer
inconsistentie gevonden, zal het worden behandeld als "data" en de inhoud van de uitvoer niet
gegarandeerd.

Hoewel bepaald tussen EUC-serie/Shift JIS-serie na gevonden 8-bits code, conversies
zijn in behandeling en plaatsen invoergegevens in de buffer, maar de buffer is vol en gaat ervan uit dat het EUC is
reeksen en krachten om de conversie te starten. Reden. Meestal kunnen we aannemen dat documenten
met kanji include JIS non-kanji of JIS first standard, kan het in bepaalde if worden gedetecteerd
het is Shift JIS , die de regio niet deelt met EUC. Dus als het niet kan worden vastgesteld,
het is zeer waarschijnlijk dat het EUC is.

8 bit JIS en het heeft altijd een even aantal kanareeksen met halve breedte, dan zal het zo zijn
ten onrechte gedetecteerd als EUC kanji. Wees ceravol.

Als invoercodering geen kana met halve breedte heeft, gebruik dan -z en de nauwkeurigheid van de detectie worden
veel beter. Dit komt omdat de gedeelde regio beperkt is tot het gebied van de JIS-seconde
normen.

Uitgebreid gebied van door de gebruiker gedefinieerd Shift JIS-gebied van EUC, controletekens C1 van EUC,
ongedefinieerde regio met kana met halve breedte van EUC valt buiten het bereik van automatische detectie, dus dat zal zo zijn
kan geen coderingen detecteren als de invoer deze tekens bevat. Gebruik -x optie op te geven
uitgebreide modus, of geef invoercode op.

Gebruik kcc online met behulp van onworks.net-services



Nieuwste Linux & Windows online programma's