kcc - ক্লাউডে অনলাইন

এটি হল kcc কমান্ড যা আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে OnWorks ফ্রি হোস্টিং প্রদানকারীতে চালানো যেতে পারে।

কার্যক্রম:

NAME এর


kcc - এনকোডিং স্বয়ংক্রিয় সনাক্তকরণ সহ কাঞ্জি কোড কভারটার

সাইনোপিসিস


কেসিসি [ -IOchnvxz ] [ -b bufsize ] [ ফাইল ]...

বর্ণনাঃ


কেসিসি এটি একটি ফিল্টার যা পড়ে ফাইল ক্রমানুসারে, কাঞ্জি এনকোডিং এবং আউটপুটকে এতে রূপান্তর করে
stdout যদি কোন ফাইল নির্দিষ্ট করা না থাকে, বা নির্দিষ্ট করা থাকে - ফাইলের নাম হিসাবে, এটি stdin থেকে পড়ে। তুমি পারবে
ইনপুট/আউটপুটের জন্য কাঞ্জি এনকোডিং নির্দিষ্ট করুন। যাহোক, কেসিসি স্বয়ংক্রিয়ভাবে ইনপুট এনকোডিগ সনাক্ত করুন,
যদি আপনি ইনপুট এনকোডিং নির্দিষ্ট না করেন।

উপলব্ধ কাঞ্জি এনকোডিং হল JIS (7 বিট এবং/অথবা 8 বিট), শিফট JISEUCDEC। ইনপুট জন্য
এনকোডিং, আপনি মিশ্রিত করতে পারেন যখন এগুলি EUC DEC বা Shift JIS এবং 7 বিট JIS এর একটি জোড়া হয়।
SI/SOESC (আমি JIS এর অর্ধ প্রস্থ হিসাবে স্বীকৃত।

বিকল্প


-O
-IO I ইনপুট কাঞ্জি এনকোডিং¡¤ জন্যO আউটপুট কাঞ্জি এনকোডিংয়ের জন্য। যখন কোন ইনপুট এনকোডিং
নির্দিষ্ট করা, এটি স্বয়ংক্রিয়ভাবে সনাক্ত করা হবে, এবং যদি ইনপুট/আউটপুট উভয়ই না হয়
নির্দিষ্ট, আউটপুট এনকোডিং হল 7 বিট JIS।

আপনি ইনপুট এনকোডিং বিকল্পের জন্য নিম্নলিখিতগুলির মধ্যে একটি নির্দিষ্ট করতে পারেন, I.

e EUC (7 বিট JIS এর সাথে উপলব্ধ)
d DEC (7 বিট JIS এর সাথে উপলব্ধ)
s শিফট JIS (7 বিট JIS এর সাথে উপলব্ধ)
j7 or k
7 বিট JIS
8 8 বিট JIS

আপনি আউটপুট এনকোডিং বিকল্পের জন্য নিম্নলিখিতগুলির মধ্যে একটি নির্দিষ্ট করতে পারেন, O.

e EUC
d ডিসেম্বর
s JIS শিফট করুন
jXY or 7XY
7 বিট JIS (ব্যবহার করেSI/SO JIS কানা উপাধির জন্য)
kXY 7 বিট JIS (ব্যবহার করেESC(I JIS কানা উপাধির জন্য)
8XY 8 বিট JIS

By XY in O বিকল্প, আপনি JIS এনকোডিং-এ কোন এস্কেপ সিকোয়েন্স ব্যবহার করা হয়েছে তা নির্দিষ্ট করতে পারেন। BJ
ডিফল্ট হয় পরিপূরক কাঞ্জি পদবি স্থির করা হয়েছে ESC$(D

X কাঞ্জি দ্বারা মনোনীত হয়:
B ESC$B(JIS X0208-1983)
@ ESC$@(JIS X0208-1978)
+ ESC&@ESC$B(JIS X0212-1990)
Y আলফা সংখ্যাসূচক দ্বারা মনোনীত করা হয়:
B ESC(B(ASCII)
J ইএসসি (জে(JIS রোমান; JIS X0201)
H ESC(H(সুইডিশ; দৃঢ়ভাবে অবজ্ঞা)

-v stderr এ ইনপুট এনকোডিং সনাক্তকরণের ফলাফল আউটপুট।

-x এক্সটেনশন মোড। ইনপুট এনকোডিংয়ের স্বয়ংক্রিয় সনাক্তকরণের মাধ্যমে, ব্যবহারকারী-সংজ্ঞায়িত চিনুন
অক্ষর এবং বর্ধিত অক্ষর অঞ্চল ( EUC এর পরিসরের বাইরে, অনির্ধারিত অর্ধ প্রস্থ
কানা, নিয়ন্ত্রণ অক্ষর, C1 এলাকা এবং/অথবা বর্ধিত অক্ষর অঞ্চল Shift C1 JIS)।
ডিইসি এবং ইইউসির মধ্যে পার্থক্য এই মোডে করা হয়।

-z সঙ্কুচিত মোড। ইনপুট এনকোডিং সহ অর্ধ প্রস্থ কানা (7 বিট JIS ছাড়া) চিনবেন না
সনাক্তকরণ এই বিকল্পের সাথে, ইনপুট এনকোডিংগুলির স্বয়ংক্রিয় সনাক্তকরণের নির্ভুলতা হয়ে যায়
অর্ধ প্রস্থ কানা ছাড়া ফাইলের জন্য অনেক ভালো।

-h সাধারণত, অর্ধপ্রস্থ কানাকে ডিইসি-তে রূপান্তর করা হলে, এটি পূর্ণপ্রস্থ কাতাকানায় পরিণত হয়।
এই বিকল্পের সাথে, এটি হিরাগানা হয়ে যায়।

-n ব্যবহারকারী-সংজ্ঞায়িত অক্ষর, বর্ধিত অক্ষর এবং পরিপূরক কাঞ্জি অক্ষর
পূর্ণপ্রস্থ সাদা বক্সে রূপান্তরিত হয়, এবং অর্ধ প্রস্থের কানা অনির্ধারিত অঞ্চল
অর্ধপ্রস্থ কেন্দ্রীভূত বিন্দুতে রূপান্তরিত।

-b bufsize
বাফার আকার নির্দিষ্ট করুন। 8kbytes ডিফল্ট।

-c রূপান্তর করবেন না কিন্তু ইনপুট এনকোডিং চেক করুন এবং stdout ফলাফল মুদ্রণ করুন। সঙ্গে বিভিন্ন
স্বাভাবিক স্বয়ংক্রিয় সনাক্তকরণ, ফাইলের সম্পূর্ণ বিষয়বস্তু পরীক্ষা করা হয়। যাইহোক, যখন
এনকোডিং এর অসঙ্গতি পাওয়া যায়, পড়া বাতিল করুন এবং "ডেটা" মুদ্রণ করুন। অপশন
ছাড়া -x¡¤-z অবহেলা করা হয়।

উদাহরণ


% কেসিসি -e ফাইল
ইনপুট এনকোডিং স্বয়ংক্রিয়ভাবে সনাক্ত করা হয়, এবং আউটপুট EUC এনকোডিং হয়।

% কেসিসি -এসজে file1 file2
শিফট JIS-এ দুটি ফাইল JIS-এ রূপান্তরিত করার সাথে সংযুক্ত।

% হুকুম | কেসিসি -k+J
এর আউটপুট হুকুম হয় ধর্মান্তরিত থেকে JIS(JIS JIS X0208 JIS JIS Roman¡¤ESC(I অর্ধ - প্রস্থ
কানা জেআইএস)

% কেসিসি -c ফাইল
এর বিষয়বস্তুর এনকোডিং ফাইল সনাক্ত করা হয়েছে (কোন রূপান্তর নেই)

বাগ


ইনপুট এনকোডিংয়ের স্বয়ংক্রিয় সনাক্তকরণ স্বাভাবিক ক্ষেত্রে ভালভাবে সম্পন্ন করা হয়, তবে, এতে রয়েছে
নিম্নলিখিত সমস্যা।

7 বিট JIS নির্দিষ্টভাবে এস্কেপ সিকোয়েন্স দ্বারা স্বীকৃত। EUC এবং DEC একই (উল্লেখিত
EUC সিরিজ হিসাবে)। 8 বিট JIS এর অর্ধ প্রস্থ কানা শিফট JIS এর অর্ধ প্রস্থ কানা সমান
(Shift JIS সিরিজ হিসাবে উল্লেখ করা হয়েছে)। যাইহোক, EUC সিরিজ এবং JIS, উভয়ই 8 বিট
এনকোডিং, একই অঞ্চলগুলি ব্যাপকভাবে ভাগ করছে৷ সুতরাং, স্বয়ংক্রিয় সনাক্তকরণে সমস্যা হয়
এই 2 এনকোডিং সনাক্তকরণ.

EUC সিরিজ/Shift JIS সিরিজের সনাক্তকরণ লাইন দ্বারা লাইনে করা হয়, যখন এটি পাওয়া যায়
এটি শিফট JIS সিরিজ নয়, বা এটি EUC সিরিজ নয়, এনকোডিং নির্ধারিত হয়। কখন
অসঙ্গতি পাওয়া গেছে, এটিকে "ডেটা" হিসাবে গণ্য করা হবে এবং আউটপুটের বিষয়বস্তু নয়
নিশ্চিত।

EUC সিরিজ/Shift JIS সিরিজের মধ্যে 8 বিট কোড পাওয়া যাওয়ার পরে, রূপান্তরগুলি নির্ধারণ করার সময়
মুলতুবি আছে এবং বাফারে ইনপুট ডেটা রাখছে, তবে, বাফার পূর্ণ হয়েছে, এটি ধরে নেওয়া হচ্ছে এটি EUC
সিরিজ এবং বাহিনী রূপান্তর শুরু করতে। যুক্তি। সাধারণত, আমরা যে নথি অনুমান করতে পারেন
কাঞ্জির সাথে JIS নন-কাঞ্জি বা JIS ফার্স্ট স্ট্যান্ডার্ড অন্তর্ভুক্ত, এটি নির্দিষ্টভাবে সনাক্ত করা যেতে পারে যদি
এটি Shift JIS, যা EUC এর সাথে অঞ্চল ভাগ করে না। তাই যদি নির্ধারণ করা না যায়,
এটি EUC হওয়ার সম্ভাবনা খুব বেশি।

8 বিট JIS এবং এটিতে সর্বদা অর্ধ প্রস্থ কানা সিকোয়েন্সের জোড় সংখ্যা থাকে, তাহলে এটি হবে
ভুলভাবে EUC কাঞ্জি হিসাবে সনাক্ত করা হয়েছে। সিরাফুল হও।

ইনপুট এনকোডিং এর অর্ধ প্রস্থ কানা না থাকলে ব্যবহার করুন -z এবং সনাক্তকরণের নির্ভুলতা হয়ে ওঠে
অনেক ভাল. কারণ ভাগ করা অঞ্চল JIS সেকেন্ডের ক্ষেত্রে সীমাবদ্ধ
মান।

শিফট JIS এর বর্ধিত অঞ্চল EUC এর ব্যবহারকারী-সংজ্ঞায়িত এলাকা, EUC এর C1 অক্ষর নিয়ন্ত্রণ,
EUC-এর অর্ধ প্রস্থ কানার অনির্ধারিত অঞ্চল স্বয়ংক্রিয় সনাক্তকরণের সীমার বাইরে, তাই এটি হবে
ইনপুটে এই অক্ষর থাকলে এনকোডিং সনাক্ত করতে ব্যর্থ হয়। ব্যবহার করুন -x নির্দিষ্ট করার বিকল্প
বর্ধিত মোড, বা ইনপুট কোড নির্দিষ্ট করুন।

onworks.net পরিষেবা ব্যবহার করে অনলাইনে kcc ব্যবহার করুন



সর্বশেষ লিনাক্স এবং উইন্ডোজ অনলাইন প্রোগ্রাম