केसीसी - क्लाउड में ऑनलाइन

यह कमांड kcc है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे कि उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।

कार्यक्रम:

नाम


केसीसी - एन्कोडिंग ऑटो डिटेक्शन के साथ कांजी कोड कवरटर

SYNOPSIS


केसीसी [ -IOchnvxz ] [ -b बफसाइज ] [ पट्टिका ]...

वर्णन


केसीसी एक फ़िल्टर है जो पढ़ता है पट्टिका क्रमिक रूप से, कांजी एन्कोडिंग और आउटपुट को परिवर्तित करता है
stdout. यदि कोई फ़ाइल निर्दिष्ट या निर्दिष्ट नहीं है - फ़ाइल नाम के रूप में, यह stdin से पढ़ा जाता है। तुम कर सकते हो
इनपुट/आउटपुट के लिए कांजी एन्कोडिंग निर्दिष्ट करें। तथापि, केसीसी स्वचालित रूप से इनपुट एन्कोडिग का पता लगाएं,
यदि आप इनपुट एन्कोडिंग निर्दिष्ट नहीं करते हैं।

उपलब्ध कांजी एन्कोडिंग JIS (7 बिट और/या 8 बिट), शिफ्ट JISEUCDEC हैं। इनपुट के लिए
एन्कोडिंग, आप तब मिश्रण कर सकते हैं जब ये EUC DEC या Shift JIS और 7 बिट JIS में से किसी एक की जोड़ी हो।
SI/SOESC(I को JIS की आधी चौड़ाई के रूप में पहचाना जाता है।

विकल्प


-O
-IO I इनपुट कांजी एन्कोडिंग¡¤ के लिएO आउटपुट कांजी एन्कोडिंग के लिए। जब कोई इनपुट एन्कोडिंग नहीं
निर्दिष्ट, यह स्वचालित रूप से पता लगाया जाएगा, और यदि इनपुट/आउटपुट दोनों नहीं हैं
निर्दिष्ट, आउटपुट एन्कोडिंग 7 बिट JIS है।

आप इनपुट एन्कोडिंग विकल्प के लिए निम्नलिखित में से एक निर्दिष्ट कर सकते हैं, I.

e EUC(7 बिट JIS के साथ उपलब्ध)
d DEC(7 बिट JIS के साथ उपलब्ध)
s शिफ्ट JIS (7 बिट JIS के साथ उपलब्ध)
j7 or k
7 बिट जेआईएस
8 8 बिट जेआईएस

आप आउटपुट एन्कोडिंग विकल्प के लिए निम्नलिखित में से एक निर्दिष्ट कर सकते हैं, O.

e ईयूसी
d दिसम्बर
s शिफ्ट JIS
jXY or 7XY
7 बिट JIS (का उपयोग करके)SI/SO JIS काना पदनाम के लिए)
kXY 7 बिट JIS (का उपयोग करके)ईएससी(आई JIS काना पदनाम के लिए)
8XY 8 बिट जेआईएस

By XY in O विकल्प, आप निर्दिष्ट कर सकते हैं कि JIS एन्कोडिंग में कौन सा एस्केप अनुक्रम उपयोग किया गया है। BJ
डिफ़ॉल्ट है. पूरक कांजी पदनाम तय किया गया है ईएससी$(डी

X कांजी को इसके द्वारा नामित किया गया है:
B ईएससी$बी(JIS X0208-1983)
@ ईएससी$@(JIS X0208-1978)
+ ESC&@ESC$B(JIS X0212-1990)
Y अल्फ़ा न्यूमेरिकल द्वारा निर्दिष्ट किया गया है:
B ईएससी(बी(एएससीआईआई)
J ईएससी(जे(JIS रोमन; JIS X0201)
H ईएससी(एच(स्वीडिश; दृढ़ता से निंदा की गई)

-v इनपुट एन्कोडिंग डिटेक्शन के परिणाम को stderr पर आउटपुट करता है।

-x एक्सटेंशन मोड. इनपुट एन्कोडिंग का स्वत: पता लगाकर, उपयोगकर्ता-परिभाषित को पहचानें
वर्ण और विस्तारित वर्ण क्षेत्र (ईयूसी की सीमा से बाहर, अपरिभाषित आधी चौड़ाई
काना, नियंत्रण वर्ण, C1 क्षेत्र और/या विस्तारित वर्ण क्षेत्र Shift C1 JIS)।
डीईसी और ईयूसी के बीच अंतर इस मोड में किया जाता है।

-z सिकुड़न मोड. इनपुट एन्कोडिंग के साथ आधी चौड़ाई काना (7 बिट जेआईएस को छोड़कर) को न पहचानें
पता लगाना. इस विकल्प के साथ, इनपुट एन्कोडिंग की ऑटो डिटेक्शन की सटीकता बन जाती है
आधी चौड़ाई काना के बिना फ़ाइल के लिए बहुत बेहतर है।

-h आम तौर पर, जब अर्ध-चौड़ाई काना को डीईसी में परिवर्तित किया जाता है, तो यह पूर्ण-चौड़ाई वाला काताकाना बन जाता है।
इस विकल्प के साथ, यह हीरागाना बन जाता है।

-n उपयोगकर्ता-परिभाषित वर्ण, विस्तारित वर्ण और पूरक कांजी वर्ण
पूर्ण-चौड़ाई वाले सफेद बॉक्स में परिवर्तित हो जाते हैं, और आधी-चौड़ाई वाले काना के अपरिभाषित क्षेत्र होते हैं
अर्ध-चौड़ाई केन्द्रित बिंदु में परिवर्तित।

-b बफसाइज
बफ़र आकार निर्दिष्ट करें. 8kbytes डिफ़ॉल्ट है.

-c कनवर्ट न करें लेकिन इनपुट एन्कोडिंग की जांच करें और परिणाम को stdout पर प्रिंट करें। साथ अलग
सामान्य स्वतः-पहचान, फ़ाइल की संपूर्ण सामग्री की जाँच की जाती है। हालाँकि, जब
एन्कोडिंग की असंगति पाई जाती है, पढ़ना रोकें और "डेटा" प्रिंट करें। विकल्प
सिवाय -x¡¤-z नजरअंदाज कर दिया जाता है।

उदाहरण


% केसीसी -e पट्टिका
इनपुट एन्कोडिंग का स्वचालित रूप से पता लगाया जाता है, और आउटपुट ईयूसी एन्कोडिंग में होता है।

% केसीसी -एसजे file1 file2
शिफ्ट JIS में दो फ़ाइलें JIS में कनवर्ट करने के साथ संयोजित हुईं।

% आदेश | केसीसी -क+ज
का उत्पादन आदेश रहे परिवर्तित सेवा मेरे JIS(JIS JIS X0208 JIS JIS रोमन¡¤ईएससी(आई आधी चौड़ाई
काना JIS )

% केसीसी -c पट्टिका
की सामग्री का एन्कोडिंग पट्टिका पता चला है (कोई रूपांतरण नहीं)

बग


सामान्य स्थिति में इनपुट एन्कोडिंग का स्वत: पता लगाना अच्छी तरह से किया जाता है, हालाँकि, इसमें यह है
निम्नलिखित समस्याएँ।

7 बिट JIS को निश्चित रूप से एस्केप अनुक्रम द्वारा पहचाना जाता है। EUC और DEC समान हैं (संदर्भित)।
ईयूसी श्रृंखला के रूप में)। 8 बिट JIS का अर्ध-चौड़ाई काना, Shift JIS के अर्ध-चौड़ाई काना के समान है
(Shift JIS श्रृंखला के रूप में संदर्भित)। हालाँकि, EUC श्रृंखला और JIS, जो दोनों 8 बिट हैं
एन्कोडिंग, समान क्षेत्रों को व्यापक रूप से साझा कर रहे हैं। तो, ऑटो डिटेक्शन में समस्या है
इन 2 एन्कोडिंग का पता लगाना।

EUC सीरीज/Shift JIS सीरीज का पता लाइन दर लाइन किया जाता है, जब यह पाया जाता है
यह Shift JIS श्रृंखला नहीं है, या यह EUC श्रृंखला नहीं है, एन्कोडिंग निर्धारित है। कब
असंगतता पाए जाने पर इसे "डेटा" माना जाएगा और आउटपुट की सामग्री को नहीं माना जाएगा
गारंटी।

जबकि 8 बिट कोड मिलने के बाद ईयूसी श्रृंखला/शिफ्ट जेआईएस श्रृंखला के बीच रूपांतरण निर्धारित किया गया
लंबित हैं और इनपुट डेटा को बफ़र में डाल दिया है, हालाँकि, बफ़र भर गया है, यह मान लिया गया है कि यह EUC है
श्रृंखला और रूपांतरण शुरू करने के लिए मजबूर करता है। तर्क. आमतौर पर, हम यह मान सकते हैं कि दस्तावेज़
कांजी के साथ जेआईएस गैर-कांजी या जेआईएस प्रथम मानक शामिल है, इसका निश्चित रूप से पता लगाया जा सकता है
यह Shift JIS है, जो EUC के साथ क्षेत्र साझा नहीं करता है। इसलिए यदि यह निर्धारित नहीं किया जा सकता है,
इसके EUC होने की बहुत अधिक संभावना है।

8 बिट जेआईएस और इसमें हमेशा आधी चौड़ाई वाले काना अनुक्रमों की संख्या सम होती है, तो यह होगा
ग़लती से ईयूसी कांजी के रूप में पहचाना गया। सावधान रहें.

यदि इनपुट एन्कोडिंग में आधी चौड़ाई काना नहीं है, तो उपयोग करें -z और पता लगाने की सटीकता बन जाती है
काफी बेहतर। ऐसा इसलिए है क्योंकि साझा क्षेत्र JIS सेकंड के क्षेत्र तक ही सीमित है
मानकों।

EUC के Shift JIS उपयोगकर्ता-परिभाषित क्षेत्र का विस्तारित क्षेत्र, EUC के नियंत्रण वर्ण C1,
ईयूसी की आधी चौड़ाई काना का अपरिभाषित क्षेत्र ऑटो डिटेक्शन की सीमा से बाहर है, इसलिए ऐसा होगा
यदि इनपुट में ये अक्षर हैं तो एन्कोडिंग का पता लगाने में विफल रहता है। उपयोग -x निर्दिष्ट करने का विकल्प
विस्तारित मोड, या इनपुट कोड निर्दिष्ट करें।

onworks.net सेवाओं का उपयोग करके ऑनलाइन केसीसी का उपयोग करें



नवीनतम Linux और Windows ऑनलाइन प्रोग्राम