Ito ang command kcc na maaaring patakbuhin sa OnWorks free hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
kcc - Kanji code coverter na may encoding auto detection
SINOPSIS
kcc [ -IOchnvxz ] [ -b bufsize ] [ file ] ...
DESCRIPTION
kcc ay isang filter na nagbabasa file sunud-sunod, kino-convert ang mga kanji encoding at output sa
stdout. Kung walang file na tinukoy, o tinukoy - bilang filename, nabasa ito mula sa stdin. Kaya mo
tukuyin ang mga kanji encoding para sa input/output. gayunpaman, kcc awtomatikong tuklasin ang input encodig,
kung hindi mo tinukoy ang pag-encode ng input.
Ang mga available na kanji encoding ay JIS (7 bit at/o 8 bit), Shift JISEUCDEC. Para sa input
pag-encode, maaari mong ihalo kapag ang mga ito ay pares ng isa sa EUC DEC o Shift JIS at 7 bit JIS.
SI/SOESC(Ako ay kinikilala bilang kalahating lapad ng JIS.
Opsyon
-O
-IO I para sa input ng kanji encoding¡¤O para sa output kanji encoding. Kapag walang input encoding
tinukoy, awtomatiko itong matutukoy, at kung pareho ang input/output ay hindi
tinukoy, ang output encoding ay 7 bit JIS.
Maaari mong tukuyin ang isa sa mga sumusunod para sa opsyon sa pag-encode ng input, I.
e EUC(magagamit na may 7 bit JIS)
d DEC (magagamit na may 7 bit JIS )
s Shift JIS(available with 7 bit JIS )
j7 or k
7 bit na JIS
8 8 bit na JIS
Maaari mong tukuyin ang isa sa mga sumusunod para sa opsyon sa pag-encode ng output, O.
e EUC
d Disyembre
s Ilipat ang JIS
jXY or 7XY
7 bit JIS(gamitSI/SO para sa pagtatalaga ng JIS kana)
kXY 7 bit JIS(gamitESC(I para sa pagtatalaga ng JIS kana)
8XY 8 bit na JIS
By XY in O opsyon, Maaari mong tukuyin kung aling escape sequence ang ginamit sa JIS encoding. BJ
ay default. Nakatakda ang pandagdag na kanji na pagtatalaga sa ESC$(D
X Ang Kanji ay itinalaga ni:
B ESC$B(JIS X0208-1983)
@ ESC$@(JIS X0208-1978)
+ ESC&@ESC$B(JIS X0212-1990)
Y Ang Alpha Numerical ay itinalaga ng:
B ESC(B(ASCII)
J ESC(J(JIS Roman; JIS X0201)
H ESC(H(Swedish; mahigpit na hindi na ginagamit)
-v resulta ng pag-detect ng pag-encode ng input sa stderr.
-x Extension mode. Sa pamamagitan ng awtomatikong pagtuklas ng mga pag-encode ng input, kilalanin ang tinukoy ng gumagamit
mga character at pinalawig na rehiyon ng character ( wala sa saklaw ng EUC, hindi natukoy na kalahating lapad
kana, control character, C1 area at/o extended character region Shift C1 JIS ).
Ang pagkakaiba sa pagitan ng DEC at EUC ay ginagawa sa mode na ito.
-z Paliitin mode. Huwag makilala ang halfwidth kana (maliban sa 7 bit JIS ) na may input encoding
pagtuklas. Sa pagpipiliang ito, nagiging katumpakan ng awtomatikong pag-detect ng mga pag-encode ng input
magkano ang mas mahusay para sa file na walang kalahating lapad kana.
-h Karaniwan, Kapag na-convert ang halfwidth kana sa DEC , ito ay nagiging fullwidth na Katakana.
Sa pagpipiliang ito, ito ay nagiging Hiragana.
-n mga character na tinukoy ng gumagamit, pinalawig na mga character at pandagdag na mga character na kanji
ay na-convert sa fullwidth na puting kahon, at hindi natukoy na rehiyon ng kalahating lapad kana ay
na-convert sa kalahating lapad na nakasentro na tuldok.
-b bufsize
tukuyin ang laki ng buffer. 8kbytes ang default.
-c huwag mag-convert ngunit suriin ang pag-encode ng input at i-print ang resulta sa stdout. Iba sa
normal na auto-detection, ang buong nilalaman ng file ay sinusuri. Gayunpaman, kapag
Ang hindi pagkakapare-pareho ng mga pag-encode ay natagpuan, i-abort ang pagbabasa at pag-print ng "data". Mga pagpipilian
maliban -x¡¤-z ay hindi pinansin.
HALIMBAWA
% kcc -e file
Awtomatikong nade-detect ang input encoding, at ang output ay nasa EUC encoding.
% kcc -sj file1 file2
Dalawang file sa Shift JIS na pinagsama sa pag-convert sa JIS.
% utos | kcc -k+J
output ng utos ay na-convert na sa JIS(JIS JIS X0208 JIS JIS Roman¡¤ESC(I Halfwidth
Kana JIS )
% kcc -c file
Pag-encode ng mga nilalaman ng file ay nakita(walang conversion)
bUG
Ang auto detection ng input encoding ay mahusay na ginawa para sa normal na kaso, gayunpaman, mayroon itong
sumusunod na mga problema.
7 bit JIS ay kinikilala sa pamamagitan ng escape sequence sa tiyak. Ang EUC at DEC ay pareho (tinukoy
bilang serye ng EUC). Ang kalahating lapad na kana ng 8 bit na JIS ay kapareho ng kalahating lapad na kana ng Shift JIS
(tinukoy bilang Shift JIS series). Gayunpaman, EUC series at JIS , na parehong 8 bit
encoding, ay malawak na nagbabahagi ng parehong mga rehiyon. Kaya, ang problema sa auto detection ay
pagtuklas ng 2 encoding na ito.
Ang pagtuklas ng serye ng EUC/Shift JIS serye ay ginagawa sa linya sa pamamagitan ng linya, Kapag ito ay natagpuan na
hindi ito serye ng Shift JIS, o hindi ito serye ng EUC, tinutukoy ang pag-encode. Kailan
hindi pagkakapare-pareho, ito ay ituturing bilang "data" at ang mga nilalaman ng output ay hindi
garantisado.
Habang tinutukoy sa pagitan ng EUC series/Shift JIS series pagkatapos makita ang 8bit code, ang mga conversion
ay nakabinbin at naglalagay ng data ng input sa buffer, gayunpaman, puno ang buffer, ipinapalagay na ito ay EUC
serye at pwersa upang simulan ang conversion. Katuwiran. Karaniwan, maaari nating ipagpalagay na ang mga dokumento
na may kanji isama ang JIS non-kanji o JIS unang pamantayan, maaari itong matukoy sa tiyak kung
ito ay Shift JIS , na hindi nagbabahagi ng rehiyon sa EUC. Kaya kung hindi matukoy,
ito ay malamang na maging EUC.
8 bit JIS at ito ay palaging kahit na bilang ng kalahating lapad na pagkakasunud-sunod ng kana, pagkatapos ito ay magiging
maling natukoy bilang EUC kanji. Maging matino.
Kung ang pag-encode ng input ay walang kalahating lapad kana, gamitin -z at nagiging katumpakan ng pagtuklas
mas mabuti. Ito ay dahil ang nakabahaging rehiyon ay limitado sa lugar ng JIS segundo
pamantayan.
Pinalawak na rehiyon ng Shift JIS na tinukoy ng gumagamit na lugar ng EUC, mga control character na C1 ng EUC,
Ang hindi natukoy na rehiyon ng kalahating lapad na kana ng EUC ay wala sa hanay ng auto detection, kaya ito ay
nabigo na makakita ng mga pag-encode kung ang input ay may mga character na ito. Gamitin -x opsyon upang tukuyin
extended mode, o tukuyin ang input code.
Gamitin ang kcc online gamit ang mga serbisyo ng onworks.net