यह कमांड mbconv है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर में से एक का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।
कार्यक्रम:
नाम
mbconv - कैरेक्टर एन्कोडिंग स्कीम कन्वर्टर
SYNOPSIS
एमबीकॉनव [विकल्प] ...
वर्णन
यह एकाधिक ऑक्टेट वर्ण एन्कोडिंग को संभालने के लिए लाइब्रेरी का एक अनुप्रयोग है:
http://pub.ks-and-ks.ne.jp/prog/libmoe/
मुख्य रूप से पुस्तकालय की डिबगिंग के लिए लिखा गया है।
यह कमांड लाइन पर दी गई फाइलों से ऑक्टेट बाय ऑक्टेट पढ़ता है (या मानक इनपुट अगर कोई फाइल नहीं है
निर्दिष्ट), कमांड लाइन विकल्पों द्वारा निर्दिष्ट वर्ण एन्कोडिंग योजना (सीईएस) को परिवर्तित करता है
(नीचे वर्णित है), और मानक आउटपुट के लिए आउटपुट (या द्वारा निर्दिष्ट फ़ाइल) -t विकल्प या -a
विकल्प)।
ऑप्शंस
-?, -h, --मदद
विकल्पों और निकासों का सारांश प्रदर्शित करें।
-a पट्टिका, --जोङना=पट्टिका
आउटपुट जोड़ा जाता है पट्टिका.
-c कन्वर्टर्स, --में बदलें=कन्वर्टर्स
वर्ण एन्कोडिंग रूपांतरण निर्दिष्ट करता है। कन्वर्टर्स अल्पविराम से अलग की गई सूची होनी चाहिए
"रूपांतरण विनिर्देशक" में वर्णित शब्द।
-f झंडे, --झंडा=झंडे
रूपांतरण के व्यवहार को बदलने के लिए झंडे निर्दिष्ट करता है। झंडे अल्पविराम से अलग की गई सूची होनी चाहिए
"ध्वज विनिर्देशक" में वर्णित शब्दों का।
-i, --इनपुट
सफल विकल्प इनपुट स्ट्रीम पर लागू होते हैं।
-m स्ट्रिंग, --माइम-चारसेट=स्ट्रिंग
RFC2047 के अनुरूप माइम एन्कोडिंग की जाती है। वर्णसेट नाम के रूप में प्रयोग किया जाता है।
-n, --रेखा संख्या
पंक्ति संख्या (>= 1) प्रत्येक पंक्ति की शुरुआत में डाली जाती है।
-o, --आउटपुट
सफल विकल्प आउटपुट स्ट्रीम पर लागू होते हैं।
-t पट्टिका, --सेवा मेरे=पट्टिका
फ़ाइल में आउटपुट (छोटा हुआ)।
-w, --चौड़ाई
प्रत्येक पंक्ति की आउटपुट चौड़ाई।
-के , --चारसेट=स्ट्रिंग
वर्णसेट नाम निर्दिष्ट करता है। कुछ भाषा विनिर्देश भी स्वीकार किए जाते हैं साथ ही
MIME वर्णसेट नाम, जो इनपुट की एन्कोडिंग योजना के उम्मीदवारों को प्रतिबंधित करने के लिए उपयोग किए जाते हैं
धारा। स्वीकार्य भाषाएं "स्वीकार्य भाषाओं" में सूचीबद्ध हैं।
--प्रारूप=स्ट्रिंग
आउटपुट स्वरूप निर्दिष्ट करता है
--कौन
प्रत्येक इनपुट स्ट्रीम का आउटपुट वर्णसेट नाम stderr में, फॉर्म में
पट्टिका नाम"" चारसेट नाम
यदि कमांड लाइन पर दो या दो से अधिक फाइलें निर्दिष्ट हैं, या
चारसेट नाम
अन्यथा।
--रेगेक्स=नियमित अभिव्यक्ति
आउटपुट को फ़िल्टर करने के लिए रेगुलर एक्सप्रेशन निर्दिष्ट करता है। कैरेक्टर एन्कोडिंग नियमित
अभिव्यक्ति फॉर्म की स्ट्रिंग डालकर निर्दिष्ट किया जा सकता है
"*"चारसेट नाम"*"
नियमित अभिव्यक्ति की शुरुआत में, अन्यथा UTF-8. कैरेक्टर एन्कोडिंग
मिलान से पहले अभिव्यक्ति को आउटपुट स्ट्रीम में बदल दिया जाता है।
रूपांतरण विनिर्देशक
प्रत्येक वर्ण के स्ट्रीम में आउटपुट होने से ठीक पहले रूपांतरण लागू किया जाता है। रूपांतरण सेटअप है
सीईएस के आधार पर स्वचालित रूप से प्रदर्शन किया। तो ज्यादातर मामलों में, आपको कन्वर्टर्स निर्दिष्ट करने की आवश्यकता नहीं है
स्पष्ट रूप से।
ASCII
घरेलू ASCII US-ASCII में परिवर्तित,
CES इनपुट/आउटपुट स्ट्रीम के लिए बाध्य सीईएस के अनुसार उचित रूप से परिवर्तित,
टू-यूसीएस
यूनिकोड में परिवर्तित,
f2h, पूर्ण-से-आधा
पूर्ण-चौड़ाई संगतता वर्ण संगत अर्ध-चौड़ाई वाले वर्णों में परिवर्तित हो जाते हैं,
एच2एफ, आधा-से-पूर्ण
आधी-चौड़ाई संगतता वर्ण संगत पूर्ण-चौड़ाई वाले वर्णों में परिवर्तित हो जाते हैं,
jix0213
जेआईएस सी 6226 या जेआईएस एक्स 0208 में कोडपॉइंट्स जो किसी भी वर्ण के लिए बाध्य नहीं हैं
जेआईएस एक्स 0213 विमान 1 में परिवर्तित,
jisx0213-आक्रामक
जेआईएस सी 6226 या जेआईएस एक्स 0208 में सभी कोडपॉइंट जेआईएस एक्स 0213 विमान 1 में परिवर्तित हो गए हैं।
एमएस-लैटिन1
0x80 और 0x9F (दोनों समावेशी) के बीच कोड बिंदु के यूनिकोड वर्ण परिवर्तित हो जाते हैं
अन्य यूनिकोड वर्णों के लिए जैसे कि वे Microsoft में उस कोड बिंदु के वर्ण हैं
विंडोज कोडपेज 1252।
ucs-to-jis0208-अतिरिक्त, jis0208-टू-यूसीएस-अतिरिक्त
कुछ JIS X 0208 और समान ग्लिफ़ वाले यूनिकोड वर्णों के बीच कन्वर्टर्स (द्वारा
एम्ब्रोस लियू के सौजन्य से[ईमेल संरक्षित]>)।
झंडा विनिर्देशक
use-0x28-for-94x94inG0, 28
अंतिम ऑक्टेट के साथ वर्णों को नामित करने के लिए "1/11 2/4 F" के बजाय "2/8 1/11 2/4 F" का उपयोग करें
4/0, 4/1, या 4/2 से G0,
ac, एएससीआई-एट-कंट्रोल
एस्केप अनुक्रम "1/11 2/8 4/2" प्रत्येक नियंत्रण वर्ण से पहले आउटपुट होता है,
नोसली, अनदेखा करें-7बिट-सिंगल-शिफ्ट
7 बिट सिंगल शिफ्ट के लिए एस्केप सीक्वेंस को नजरअंदाज किया जाता है,
DNC, त्यागें-पसंदीदा-चार
उन वर्णों को छोड़ दें जो CES आउटपुट स्ट्रीम से बंधे हैं और डिकोड नहीं कर सकते हैं।
स्वीकार्य भाषाओं
इनपुट स्ट्रीम के लिए MIME वर्णसेट नाम के स्थान पर निम्नलिखित शब्द दिए जा सकते हैं। में वह
मामले में, एन्कोडिंग योजना स्वचालित रूप से सफल लोगों के बीच (उम्मीद है) पता चला है।
c, cn, चीन, चीनी
x-gb-18030-2000, cn-big5, utf-8, या x-euc-tw।
j, ja, jp, जापान, जापानी
euc-jp, shift_jis, या utf-8.
k, ko, kr, कोरिया, कोरियाई
euc-kr, x-johab, utf-8, या x-एकीकृत-हंगुल।
CJK आईएसओ-8859-1, एक्स-जीबी-18030-2000, सीएन-बिग5, एक्स-ईयूसी-टीडब्ल्यू, ईयूसी-जेपी, शिफ्ट_जिस, ईयूसी-केआर, एक्स-जोहाब,
x-एकीकृत-हंगुल, या utf-8।
onworks.net सेवाओं का उपयोग करके mbconv का ऑनलाइन उपयोग करें