এটি হল mbconv কমান্ড যা আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে OnWorks ফ্রি হোস্টিং প্রদানকারীতে চালানো যেতে পারে।
কার্যক্রম:
NAME এর
mbconv - ক্যারেক্টার এনকোডিং স্কিম কনভার্টার
সাইনোপিসিস
mbconv [বিকল্প] ...
বর্ণনাঃ
এটি একাধিক অক্টেট অক্ষর এনকোডিং পরিচালনা করার জন্য একটি লাইব্রেরির একটি অ্যাপ্লিকেশন:
http://pub.ks-and-ks.ne.jp/prog/libmoe/
মূলত লাইব্রেরির ডিবাগিংয়ের জন্য লেখা।
এটি কমান্ড লাইনে প্রদত্ত ফাইলগুলি থেকে অক্টেট দ্বারা অক্টেট পড়ে (অথবা কোনও ফাইল না থাকলে স্ট্যান্ডার্ড ইনপুট
নির্দিষ্ট), কমান্ড লাইন বিকল্প দ্বারা নির্দিষ্ট করা চরিত্র এনকোডিং স্কিম (CES) রূপান্তর করে
(নীচে বর্ণিত), এবং স্ট্যান্ডার্ড আউটপুটে আউটপুট (বা দ্বারা নির্দিষ্ট করা একটি ফাইল -t বিকল্প বা -a
বিকল্প)।
অপশন সমূহ
-?, -h, --help
অপশন এবং প্রস্থানের সারাংশ প্রদর্শন করুন।
-a ফাইল, --সংযোজন-এ=ফাইল
আউটপুট যোগ করা হয় ফাইল.
-c পরিবর্তক, --রূপান্তর=পরিবর্তক
অক্ষর এনকোডিং রূপান্তর নির্দিষ্ট করে। পরিবর্তক কমা দ্বারা বিভক্ত তালিকা হতে হবে
"রূপান্তর স্পেসিফায়ার"-এ বর্ণিত শব্দ।
-f পতাকা, --পতাকা=পতাকা
রূপান্তরের আচরণ পরিবর্তন করার জন্য পতাকা নির্দিষ্ট করে। পতাকা কমা বিভক্ত তালিকা হতে হবে
"ফ্ল্যাগ স্পেসিফায়ার"-এ বর্ণনা করা হয়েছে।
-i, --ইনপুট
পরবর্তী বিকল্পগুলি ইনপুট স্ট্রীমে প্রযোজ্য।
-m স্ট্রিং, --মাইম-চারসেট=স্ট্রিং
RFC2047 এর সাথে সঙ্গতিপূর্ণ মাইম এনকোডিং সঞ্চালিত হয়। অক্ষরসেট নাম হিসাবে ব্যবহৃত হয়।
-n, --লাইন সংখ্যা
লাইন সংখ্যা (>= 1) প্রতিটি লাইনের শুরুতে ঢোকানো হয়।
-o, --আউটপুট
সফল বিকল্পগুলি আউটপুট স্ট্রীমে প্রযোজ্য।
-t ফাইল, --প্রতি=ফাইল
ফাইলে আউটপুট (কাটা)।
-w, --প্রস্থ
প্রতিটি লাইনের আউটপুট প্রস্থ।
-সিএস , -- অক্ষর সেট=স্ট্রিং
অক্ষর সেটের নাম নির্দিষ্ট করে। কিছু ভাষার স্পেসিফিকেশন পাশাপাশি গৃহীত হয়
MIME অক্ষরসেট নাম, যা ইনপুট এনকোডিং স্কিমের প্রার্থীদের সীমাবদ্ধ করতে ব্যবহৃত হয়
প্রবাহ গ্রহণযোগ্য ভাষাগুলি "গ্রহণযোগ্য ভাষাগুলিতে" তালিকাভুক্ত করা হয়েছে।
--ফরম্যাট=স্ট্রিং
আউটপুট বিন্যাস নির্দিষ্ট করে
--যা
প্রতিটি ইনপুট স্ট্রীমের আউটপুট অক্ষরসেটের নাম stderr-এ, ফর্মে
ফাইল নাম"" চারসেট নাম
যদি কমান্ড লাইনে দুই বা ততোধিক ফাইল নির্দিষ্ট করা থাকে, বা
চারসেট নাম
অন্যথায়।
--regex=নিয়মিত অভিব্যক্তি
আউটপুট ফিল্টার করতে নিয়মিত এক্সপ্রেশন নির্দিষ্ট করে। এর অক্ষর এনকোডিং নিয়মিত
অভিব্যক্তি ফর্মের স্ট্রিং বসিয়ে নির্দিষ্ট করা যেতে পারে
"*"চারসেট নাম"*"
রেগুলার এক্সপ্রেশনের শুরুতে, অন্যথায় হল UTF-8. এর অক্ষর এনকোডিং
এক্সপ্রেশন ম্যাচিং আগে আউটপুট স্ট্রীম যে রূপান্তরিত হয়.
পরিবর্তন নির্দিষ্টকরী
প্রতিটি অক্ষর স্ট্রীমে আউটপুট হওয়ার ঠিক আগে রূপান্তর প্রয়োগ করা হয়। রূপান্তর সেটআপ হয়
স্বয়ংক্রিয়ভাবে CES উপর ভিত্তি করে সঞ্চালিত. তাই বেশিরভাগ ক্ষেত্রে, আপনাকে রূপান্তরকারী নির্দিষ্ট করতে হবে না
স্পষ্টভাবে।
ASCII
দেশীয় ASCII US-ASCII তে রূপান্তরিত হয়েছে,
এই ইনপুট/আউটপুট স্ট্রীমে আবদ্ধ CES অনুযায়ী যথাযথভাবে রূপান্তরিত করা হয়েছে,
to-ucs
ইউনিকোডে রূপান্তরিত,
f2h, সম্পূর্ণ থেকে অর্ধেক
সম্পূর্ণ প্রস্থের সামঞ্জস্যপূর্ণ অক্ষরগুলি সংশ্লিষ্ট অর্ধ প্রস্থে রূপান্তরিত হয়,
h2f, অর্ধেক থেকে পূর্ণ
অর্ধ প্রস্থ সামঞ্জস্যপূর্ণ অক্ষরগুলি সংশ্লিষ্ট পূর্ণ প্রস্থে রূপান্তরিত হয়,
jisx0213
JIS C 6226 বা JIS X 0208-এ যে কোডপয়েন্টগুলি কোন অক্ষরের সাথে আবদ্ধ নয়
JIS X 0213 প্লেন 1 এ রূপান্তরিত হয়েছে,
jisx0213-আক্রমনাত্মক
JIS C 6226 বা JIS X 0208-এর সমস্ত কোডপয়েন্ট JIS X 0213 প্লেন 1-এ রূপান্তরিত হয়,
ms-ল্যাটিন1
0x80 এবং 0x9F এর মধ্যে কোড পয়েন্টের ইউনিকোড অক্ষর (উভয়ই অন্তর্ভুক্ত) রূপান্তরিত হয়
অন্যান্য ইউনিকোড অক্ষরগুলিতে যেন তারা মাইক্রোসফ্টের সেই কোড পয়েন্টের অক্ষর
উইন্ডোজ কোডপেজ 1252।
ucs-to-jis0208-অতিরিক্ত, jis0208-থেকে-ucs-অতিরিক্ত
কিছু JIS X 0208 এবং ইউনিকোড অক্ষরের মধ্যে রূপান্তরকারীর একই রকম গ্লিফ রয়েছে (দ্বারা
অ্যামব্রোস লি এর সৌজন্যে[ইমেল সুরক্ষিত]>)।
পতাকা নির্দিষ্টকরী
use-0x28-for-94x94inG0, 28
চূড়ান্ত অক্টেট সহ অক্ষরগুলিকে মনোনীত করতে "1/11 2/4 F" এর পরিবর্তে "2/8 1/11 2/4 F" ব্যবহার করুন
4/0, 4/1, বা 4/2 থেকে G0,
ac, ascii-এ-নিয়ন্ত্রণ
এস্কেপ সিকোয়েন্স "1/11 2/8 4/2" প্রতিটি নিয়ন্ত্রণ অক্ষরের আগে আউটপুট,
nossl, উপেক্ষা করুন-7বিট-একক-শিফট
7 বিট একক শিফটের জন্য এস্কেপ সিকোয়েন্স উপেক্ষা করা হয়,
DNC, discard-notprefered-char
সিইএস আউটপুট স্ট্রীমের সাথে আবদ্ধ অক্ষরগুলিকে ডিকোড করতে পারে না।
গ্রহণযোগ্য প্রত্যেক
ইনপুট স্ট্রীমের জন্য MIME অক্ষরসেট নামের পরিবর্তে নিম্নলিখিত শব্দগুলি দেওয়া যেতে পারে। তার মধ্যে
ক্ষেত্রে, এনকোডিং স্কিম স্বয়ংক্রিয়ভাবে সনাক্ত করা হয় (আশা করি) পরবর্তীদের মধ্যে।
c, cn, চীন, চীনা
x-gb-18030-2000, cn-big5, utf-8, বা x-euc-tw.
j, ja, jp, জাপান, জাপানি
euc-jp, shift_jis, বা utf-8.
k, ko, kr, কোরিয়া, কোরিয়ান
euc-kr, x-johab, utf-8, বা x-unified-hangul.
cjk iso-8859-1, x-gb-18030-2000, cn-big5, x-euc-tw, euc-jp, shift_jis, euc-kr, x-johab,
x-ইউনিফাইড-হাঙ্গুল, বা utf-8.
onworks.net পরিষেবা ব্যবহার করে mbconv অনলাইন ব্যবহার করুন