GoGPT Best VPN GoSearch

ऑनवर्क्स फ़ेविकॉन

enc2xs - क्लाउड में ऑनलाइन

उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर पर ऑनवर्क्स मुफ्त होस्टिंग प्रदाता में enc2xs चलाएं

यह कमांड enc2xs है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।

कार्यक्रम:

नाम


enc2xs - पर्ल एनकोड मॉड्यूल जेनरेटर

SYNOPSIS


enc2xs -[विकल्प]
enc2xs -M ModName मैपफ़ाइलें...
enc2xs -सी

वर्णन


2xs यूनिकोड कैरेक्टर मैपिंग से एनकोड द्वारा उपयोग के लिए एक पर्ल एक्सटेंशन बनाता है
फ़ाइलें (.ucm) या Tcl एन्कोडिंग फ़ाइलें (.enc)। निर्माण के दौरान आंतरिक रूप से उपयोग किए जाने के अलावा
एनकोड मॉड्यूल की प्रक्रिया, आप उपयोग कर सकते हैं 2xs पर्ल में अपनी खुद की एन्कोडिंग जोड़ने के लिए। नहीं
XS का ज्ञान आवश्यक है.

त्वरित मार्गदर्शिका


यदि आप पर्ल के बारे में जितना संभव हो उतना कम जानना चाहते हैं लेकिन एक नई एन्कोडिंग जोड़ने की आवश्यकता है, बस
इस अध्याय को पढ़ें और बाकी को भूल जाएं।

0. एक .ucm फ़ाइल तैयार रखें। आप इसे कहीं से प्राप्त कर सकते हैं या आप स्वयं भी लिख सकते हैं
स्क्रैच करें या आप एनकोड वितरण से एक ले सकते हैं और इसे अनुकूलित कर सकते हैं। के लिए
यूसीएम प्रारूप, अगला अध्याय देखें। नीचे दिए गए उदाहरण में, मैं अपना सैद्धांतिक कहूंगा
एन्कोडिंग myascii, में परिभाषित my.ucm. "$" एक शेल प्रॉम्प्ट है।

$ एलएस -एफ
my.ucm

1. निम्नानुसार एक आदेश जारी करें;

$ enc2xs -M मेरा my.ucm
Makefile.PL उत्पन्न करना
My.pm उत्पन्न करना
रीडमी उत्पन्न करना
परिवर्तन उत्पन्न करना

अब अपनी वर्तमान निर्देशिका पर एक नज़र डालें। इसे ऐसा दिखना चाहिए।

$ एलएस -एफ
Makefile.PL My.pm my.ucm t/

निम्नलिखित फ़ाइलें बनाई गईं.

Makefile.PL - मेकमेकर स्क्रिप्ट
My.pm - सबमॉड्यूल को एनकोड करें
t/My.t - परीक्षण फ़ाइल

1.1.
यदि आप *.ucm को मॉड्यूल के साथ स्थापित करना चाहते हैं, तो निम्नानुसार करें;

$ mkdir एनकोड
$ एमवी *.यूसीएम एनकोड
$ enc2xs -M मेरा एनकोड/*ucm

2. उत्पन्न फ़ाइलों को संपादित करें। यदि आपके पास समय नहीं है और इरादा नहीं है तो आपको ऐसा करने की ज़रूरत नहीं है
इसे किसी और को दे दो. लेकिन पॉड को संपादित करना और अधिक परीक्षण जोड़ना एक अच्छा विचार है।

3. अब सभी पर्ल मोंगर्स को पसंद आने वाला एक आदेश जारी करें:

$ पर्ल मेकफ़ाइल.पीएल
एनकोड::माय के लिए मेकफ़ाइल लिखना

4. अब आपको बस बनाना है.

$ मेकअप
सीपी My.pm blib/lib/Encode/My.pm
/usr/local/bin/perl /usr/local/bin/enc2xs -Q -O \
-o encode_t.c -f encode_t.fnm
Myascii पढ़ना (myascii)
संकलित प्रपत्र लिखना
स्ट्रिंग तालिकाओं में 128 बाइट्स
384 बाइट्स (75%) ने डुप्लिकेट का पता लगाकर बचाया
सबस्ट्रिंग का उपयोग करके 1 बाइट्स (0.775%) सहेजे गए
....
chmod 644 blib/arch/auto/Encode/My/My.bs
$

इसमें लगने वाला समय इस बात पर निर्भर करता है कि आपकी मशीन कितनी तेज़ है और आपकी मशीन कितनी बड़ी है
एन्कोडिंग है. जब तक आप euc-tw जैसी किसी बड़ी चीज़ पर काम नहीं कर रहे हैं, इसमें भी समय नहीं लगेगा
लंबा।

5. आप पहले से ही "इंस्टॉल कर सकते हैं" लेकिन आपको पहले परीक्षण करना चाहिए।

$ परीक्षण करें
PERL_DL_NONLAZY=1 /usr/local/bin/perl -Iblib/arch -Iblib/lib \
-e 'टेस्ट का उपयोग करें::हार्नेस qw(&runtests $verbose); \
$verbose=0; रनटेस्ट @ARGV;' टी/*.टी
टी/माय... ठीक है
सभी परीक्षण सफल.
फ़ाइलें=1, परीक्षण=2, 0 वॉलक्लॉक सेकंड
(0.09 क्यूएसआर + 0.01 सीएसआईएस = 0.09 सीपीयू)

6. यदि आप परीक्षा परिणाम से संतुष्ट हैं, तो बस "इंस्टॉल करें"

7. यदि आप अपनी एन्कोडिंग को एनकोड की डिमांड-लोडिंग सूची में जोड़ना चाहते हैं (ताकि आपको ऐसा न करना पड़े)
"एनकोड::योरएन्कोडिंग का उपयोग करें"), चलाएँ

enc2xs -सी

Encode::ConfigLocal को अद्यतन करने के लिए, एक मॉड्यूल जो स्थानीय सेटिंग्स को नियंत्रित करता है। इसके बाद,
"एनकोड का उपयोग करें;" आपकी एन्कोडिंग को मांग पर लोड करने के लिए पर्याप्त है।

RSI यूनिकोड चरित्र नक्शा


एनकोड स्रोत कैरेक्टर मैपिंग के लिए यूनिकोड कैरेक्टर मैप (यूसीएम) प्रारूप का उपयोग करता है। यह
प्रारूप का उपयोग आईबीएम के आईसीयू पैकेज द्वारा किया जाता है और इसे निक इंग-सीमन्स द्वारा उपयोग के लिए अपनाया गया था
एनकोड मॉड्यूल. चूंकि यूसीएम टीसीएल के एन्कोडिंग मैप की तुलना में अधिक लचीला है और कहीं अधिक उपयोगकर्ता-
अनुकूल, यह अब एनकोड के लिए अनुशंसित प्रारूप है।

एक यूसीएम फ़ाइल इस तरह दिखती है।

#
# टिप्पणियाँ
#
"US-ascii" # आवश्यक
"ascii" # वैकल्पिक
1# आवश्यक; आमतौर पर 1
1# अधिकतम. # बाइट्स/चार का
\x3F # प्रतिस्थापन वर्ण
#
आकर्षण
\x0000 |00 #
\x0001 |01 #
\x0002 |02 #
....
\x007C |7 # लंबवत रेखा
\x007D |7 # दायां घुंघराले ब्रैकेट
\x007E |7 # टिल्डे
\x007F |7 #
आकर्षण समाप्त करें

· "#" के बाद आने वाली किसी भी चीज़ को एक टिप्पणी के रूप में माना जाता है।

· हेडर अनुभाग तब तक जारी रहता है जब तक कि CHARMAP शब्द वाली पंक्ति न आ जाए। यह अनुभाग
का एक रूप है मूल्य, प्रति पंक्ति एक जोड़ी. मान के रूप में उपयोग की जाने वाली स्ट्रिंग होनी चाहिए
उद्धृत. नंगे शब्दों को संख्याओं के रूप में माना जाता है। \xXX एक बाइट का प्रतिनिधित्व करता है.

अधिकांश कीवर्ड स्व-व्याख्यात्मक हैं। उपचर मतलब प्रतिस्थापन चरित्र, नहीं
उपचरित्र. जब आप यूनिकोड अनुक्रम को इस एन्कोडिंग से डिकोड करते हैं लेकिन कोई मिलान नहीं होता है
चरित्र पाया जाता है, यहां परिभाषित बाइट अनुक्रम का उपयोग किया जाएगा। अधिकांश मामलों के लिए,
यहाँ मान \x3F है; ASCII में, यह एक प्रश्न चिह्न है।

· CHARMAP चरित्र मानचित्र अनुभाग शुरू करता है। प्रत्येक पंक्ति का एक रूप इस प्रकार है:

\xXX.. |0 # टिप्पणी
^ ^ ^
| | +- फ़ॉलबैक ध्वज
| +------- एन्कोडेड बाइट अनुक्रम
+---------------------- हेक्स में यूनिकोड कैरेक्टर आईडी

फ़ॉलबैक फ़्लैग को छोड़कर प्रारूप लगभग हेडर अनुभाग के समान है: |
इसके बाद 0..3. संभावित मानों का अर्थ इस प्रकार है:

|0 राउंड ट्रिप सुरक्षित। यूनिकोड में डिकोड किया गया एक कैरेक्टर वापस उसी बाइट में एनकोड हो जाता है
अनुक्रम। अधिकांश पात्रों के पास यह ध्वज है।

|1 यूनिकोड के लिए फ़ॉलबैक -> एन्कोडिंग। जब देखा जाता है, तो enc2xs इस वर्ण को जोड़ता है
केवल मानचित्र को एन्कोड करें।

|2 कोई कोड बिंदु न होने पर उप-चार मैपिंग छोड़ें।

|3 एन्कोडिंग के लिए फ़ॉलबैक -> यूनिकोड। जब देखा जाता है, तो enc2xs इस वर्ण को जोड़ता है
केवल मानचित्र को डिकोड करें।

· और अंत में, चार्मैप का अंत अनुभाग को समाप्त करता है।

जब आप मैन्युअल रूप से एक यूसीएम फ़ाइल बना रहे हैं, तो आपको ascii.ucm या किसी मौजूदा की प्रतिलिपि बनानी चाहिए
एन्कोडिंग जो स्क्रैच से अपना खुद का लिखने के बजाय आपके करीब है।

जब आप ऐसा करें, तो सुनिश्चित करें कि आप कम से कम निकलें U0000 सेवा मेरे U0020 जैसा है, जब तक कि आपका वातावरण न हो
ईबीसीडीआईसी है.

चेतावनी: यूसीएम में सभी सुविधाएँ लागू नहीं हैं। उदाहरण के लिए, icu:state का उपयोग नहीं किया जाता है।
उसके कारण, यदि आप एल्गोरिथम का समर्थन करना चाहते हैं तो आपको एक पर्ल मॉड्यूल लिखना होगा
एन्कोडिंग, विशेष रूप से ISO-2022 श्रृंखला। ऐसे मॉड्यूल में एनकोड::जेपी::2022_जेपी, शामिल हैं
एनकोड::KR::2022_KR, और एनकोड::TW::HZ।

परछती साथ में नक़ल मैपिंग
जब आप कोई नक्शा बनाते हैं, तो आपको अपनी मैपिंग को राउंड-ट्रिप सुरक्षित बनाना चाहिए। वह है,
"एनकोड('आपका-एनकोडिंग', डीकोड('आपका-एनकोडिंग', $डेटा)) ईक्यू $डेटा" का मतलब सभी है
वे अक्षर जिन्हें "|0" के रूप में चिह्नित किया गया है। यहां यह सुनिश्चित करने का तरीका बताया गया है:

· अपने मानचित्र को यूनिकोड क्रम में क्रमबद्ध करें।

· जब आपके पास डुप्लिकेट प्रविष्टि हो, तो किसी एक को '|1' या '|3' से चिह्नित करें।

· और सुनिश्चित करें कि '|1' या '|3' प्रविष्टि '|0' प्रविष्टि का अनुसरण करती है।

यहां big5-eten से एक उदाहरण दिया गया है।

\xF2550\xF9 |9
\xA2550\xA2 |4

आंतरिक रूप से एन्कोडिंग -> यूनिकोड और यूनिकोड -> एन्कोडिंग मानचित्र इस तरह दिखता है;

ई से यूयू से ई
--------------------------------------
\xF9\xF9 => U2550 U2550 => \xF9\xF9
\xA2\xA4 => U2550

इसलिए यह \xF9\xF9 के लिए राउंड-ट्रिप सुरक्षित है। लेकिन यदि ऊपर की रेखा उल्टी है, तो यहाँ क्या है
हो जाता।

ई से यूयू से ई
--------------------------------------
\xA2\xA4 => U2550 U2550 => \xF9\xF9
(\xF9\xF9 => U2550 अब अधिलेखित हो गया है!)

एनकोड पैकेज के साथ आता है ucmlint, जांचने के लिए एक अपरिष्कृत लेकिन पर्याप्त उपयोगिता
यूसीएम फ़ाइल की अखंडता। इसके लिए एनकोड/बिन निर्देशिका के अंतर्गत जाँच करें।

जब संदेह हो तो आप इसका उपयोग कर सकते हैं ucmsort, एनकोड/बिन निर्देशिका के अंतर्गत एक और उपयोगिता।

बुकमार्क


· आईसीयू होम पेजhttp://www.icu-project.org/>

· आईसीयू कैरेक्टर मैपिंग टेबल्सhttp://site.icu-project.org/charts/charset>

· आईसीयू: रूपांतरण डेटाhttp://www.icu-project.org/userguide/conversion-data.html>

onworks.net सेवाओं का उपयोग करके ऑनलाइन enc2xs का उपयोग करें


फ्री सर्वर और वर्कस्टेशन

विंडोज और लाइनेक्स एप डाउनलोड करें

लिनक्स कमांड

Ad




×
विज्ञापन
❤️यहां खरीदारी करें, बुक करें या खरीदें - कोई शुल्क नहीं, इससे सेवाएं निःशुल्क बनी रहती हैं।