ইংরেজিফরাসিস্প্যানিশ

Ad


অনওয়ার্কস ফেভিকন

enc2xs - ক্লাউডে অনলাইন

উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটরের মাধ্যমে OnWorks ফ্রি হোস্টিং প্রদানকারীতে enc2xs চালান

এটি হল enc2xs কমান্ড যা আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে OnWorks ফ্রি হোস্টিং প্রদানকারীতে চালানো যেতে পারে।

কার্যক্রম:

NAME এর


enc2xs -- পার্ল এনকোড মডিউল জেনারেটর

সাইনোপিসিস


enc2xs - [বিকল্প]
enc2xs -M ModName ম্যাপফাইল...
enc2xs -C

বর্ণনাঃ


enc2xs ইউনিকোড ক্যারেক্টার ম্যাপিং থেকে এনকোড দ্বারা ব্যবহারের জন্য একটি পার্ল এক্সটেনশন তৈরি করে
ফাইল (.ucm) বা Tcl এনকোডিং ফাইল (.enc)। নির্মাণের সময় অভ্যন্তরীণভাবে ব্যবহার করা ছাড়াও
এনকোড মডিউলের প্রক্রিয়া, আপনি ব্যবহার করতে পারেন enc2xs পার্লে আপনার নিজস্ব এনকোডিং যোগ করতে। না
XS এর জ্ঞান প্রয়োজন।

দ্রুত গাইড


আপনি যদি পার্ল সম্পর্কে যতটা সম্ভব কম জানতে চান তবে একটি নতুন এনকোডিং যোগ করতে হবে, শুধু
এই অধ্যায় পড়ুন এবং বাকি ভুলে যান.

0. একটি .ucm ফাইল প্রস্তুত রাখুন। আপনি এটি কোথাও থেকে পেতে পারেন বা আপনি নিজের থেকে লিখতে পারেন
স্ক্র্যাচ বা আপনি এনকোড বিতরণ থেকে একটি দখল করতে পারেন এবং এটি কাস্টমাইজ করতে পারেন। জন্য
UCM বিন্যাস, পরবর্তী অধ্যায় দেখুন। নীচের উদাহরণে, আমি আমার তাত্ত্বিক কল করব
এনকোডিং myascii, সংজ্ঞায়িত my.ucm. "$" একটি শেল প্রম্পট।

$ls -F
my.ucm

1. নিম্নরূপ একটি আদেশ জারি;

$ enc2xs -M আমার my.ucm
Makefile.PL তৈরি করা হচ্ছে
My.pm তৈরি করা হচ্ছে
README তৈরি করা হচ্ছে
পরিবর্তন তৈরি করা

এখন আপনার বর্তমান ডিরেক্টরিটি একবার দেখুন। এটিকে ঐটির মত দেখতে হবে।

$ls -F
Makefile.PL My.pm my.ucm t/

নিম্নলিখিত ফাইল তৈরি করা হয়েছে.

Makefile.PL - MakeMaker স্ক্রিপ্ট
My.pm - সাবমডিউল এনকোড করুন
t/My.t - পরীক্ষার ফাইল

1.1.
আপনি যদি মডিউলগুলির সাথে *.ucm ইনস্টল করতে চান তবে নিম্নরূপ করুন;

$ mkdir এনকোড
$ mv *.ucm এনকোড
$ enc2xs -M আমার এনকোড/*ucm

2. উত্পন্ন ফাইল সম্পাদনা করুন. আপনার যদি সময় না থাকে এবং করার কোনো ইচ্ছা না থাকে তবে আপনাকে করতে হবে না
অন্য কাউকে দাও। কিন্তু পড সম্পাদনা করা এবং আরও পরীক্ষা যোগ করা একটি ভাল ধারণা।

3. এখন সমস্ত পার্ল মঙ্গারদের পছন্দের একটি আদেশ জারি করুন:

$ perl Makefile.PL
এনকোডের জন্য মেকফাইল লেখা::আমার

4. এখন আপনাকে যা করতে হবে তা হল।

আমি তৈরি
cp My.pm blib/lib/Encode/My.pm
/usr/local/bin/perl /usr/local/bin/enc2xs -Q -O \
-o encode_t.c -f encode_t.fnm
পড়া myascii (myascii)
সংকলিত ফর্ম লেখা
স্ট্রিং টেবিলে 128 বাইট
384 বাইট (75%) সংরক্ষিত স্পটিং ডুপ্লিকেট
1 বাইট (0.775%) সাবস্ট্রিং ব্যবহার করে সংরক্ষণ করা হয়েছে
....
chmod 644 blib/arch/auto/Encode/My/My.bs
$

আপনার মেশিন কত দ্রুত এবং আপনার কত বড় তার উপর নির্ভর করে এটির সময় পরিবর্তিত হয়
এনকোডিং হয়। আপনি euc-tw এর মতো বড় কিছুতে কাজ না করলে, এটিও লাগবে না
দীর্ঘ।

5. আপনি ইতিমধ্যেই "ইনস্টল" করতে পারেন তবে আপনাকে প্রথমে পরীক্ষা করা উচিত।

$ পরীক্ষা করা
PERL_DL_NONLAZY=1 /usr/local/bin/perl -Iblib/arch -Iblib/lib \
-e 'পরীক্ষা::হারনেস qw(&runtests $verbose); \
$verbose=0; রানটেস্ট @ARGV;' t/*.t
t/আমার....ঠিক আছে
সব পরীক্ষা সফল।
ফাইল=1, পরীক্ষা=2, 0 ওয়ালক্লক সেকেন্ড
(0.09 cusr + 0.01 csys = 0.09 CPU)

6. আপনি যদি পরীক্ষার ফলাফলে সন্তুষ্ট হন, তাহলে শুধু "ইনস্টল করুন"

7. আপনি যদি এনকোডের চাহিদা-লোডিং তালিকায় আপনার এনকোডিং যোগ করতে চান (তাই আপনাকে করতে হবে না
"এনকোড ব্যবহার করুন::YourEncoding"), চালান

enc2xs -C

Encode::ConfigLocal আপডেট করতে, একটি মডিউল যা স্থানীয় সেটিংস নিয়ন্ত্রণ করে। তারপর,
"এনকোড ব্যবহার করুন;" চাহিদা অনুযায়ী আপনার এনকোডিং লোড করার জন্য যথেষ্ট।

সার্জারির ইউনিকোড চরিত্র মানচিত্র


উৎস ক্যারেক্টার ম্যাপিংয়ের জন্য এনকোড ইউনিকোড ক্যারেক্টার ম্যাপ (UCM) ফরম্যাট ব্যবহার করে। এই
বিন্যাসটি আইবিএম-এর আইসিইউ প্যাকেজ দ্বারা ব্যবহৃত হয় এবং নিক ইং-সিমন্স দ্বারা গৃহীত হয়েছিল
এনকোড মডিউল। যেহেতু UCM টিসিএল এর এনকোডিং মানচিত্রের চেয়ে বেশি নমনীয় এবং অনেক বেশি ব্যবহারকারী-
বন্ধুত্বপূর্ণ, এটি এখন এনকোডের জন্য প্রস্তাবিত বিন্যাস।

একটি UCM ফাইল এই মত দেখায়.

#
# মন্তব্য
#
"US-ascii" # প্রয়োজন
"ascii" # ঐচ্ছিক
1 # প্রয়োজনীয়; সাধারণত 1
1 # সর্বোচ্চ। # এর বাইট/চার
\x3F # প্রতিস্থাপন চর
#
চার্মপ
\x0000 | 00 #
\x0001 | 01 #
\x0002 | 02 #
....
\x007C | 7 # উল্লম্ব লাইন
\x007D |7 # ডান কোঁকড়া বন্ধনী
\x007E | 7 # টিল্ড
\x007F | 7 #
চার্মাপ শেষ করুন

· "#" অনুসরণকারী যেকোনো কিছুকে মন্তব্য হিসেবে গণ্য করা হয়।

হেডার বিভাগটি CHARMAP শব্দ সম্বলিত একটি লাইন পর্যন্ত চলতে থাকে। এই শাখা
এর একটি ফর্ম আছে মূল্য, প্রতি লাইনে এক জোড়া। মান হিসাবে ব্যবহৃত স্ট্রিং অবশ্যই হতে হবে
উদ্ধৃত বেয়ারওয়ার্ডগুলিকে সংখ্যা হিসাবে বিবেচনা করা হয়। \xXXX একটি বাইট প্রতিনিধিত্ব করে।

বেশিরভাগ কীওয়ার্ডই স্ব-ব্যাখ্যামূলক। সাবচার প্রতিস্থাপন চরিত্র মানে, না
উপ-অক্ষর যখন আপনি এই এনকোডিংয়ের একটি ইউনিকোড ক্রম ডিকোড করেন কিন্তু কোন মিল নেই
অক্ষর পাওয়া যায়, এখানে সংজ্ঞায়িত বাইট ক্রম ব্যবহার করা হবে। বেশিরভাগ ক্ষেত্রে,
এখানে মান হল \x3F; ASCII-তে, এটি একটি প্রশ্নবোধক চিহ্ন।

· CHARMAP অক্ষর মানচিত্র বিভাগ শুরু করে। প্রতিটি লাইনের একটি ফর্ম রয়েছে:

\xXXX... |0 # মন্তব্য
^ ^ ^
| | +- ফলব্যাক পতাকা
| +--------- এনকোডেড বাইট সিকোয়েন্স
+--------------- হেক্সে ইউনিকোড ক্যারেক্টার আইডি

ফরম্যাটটি ফলব্যাক পতাকা ব্যতীত শিরোনাম বিভাগের মতো মোটামুটি একই: |
0..3 দ্বারা অনুসরণ করা সম্ভাব্য মানগুলির অর্থ নিম্নরূপ:

|0 রাউন্ড ট্রিপ নিরাপদ। ইউনিকোডে ডিকোড করা একটি অক্ষর একই বাইটে এনকোড করে
ক্রম. অধিকাংশ অক্ষর এই পতাকা আছে.

|1 ইউনিকোড -> এনকোডিংয়ের জন্য ফলব্যাক। দেখা হলে, enc2xs-এর জন্য এই অক্ষর যোগ করে
শুধুমাত্র এনকোড মানচিত্র।

|2 কোন কোড পয়েন্ট না থাকা উচিত সাব-চার ম্যাপিং এড়িয়ে যান।

|3 এনকোডিংয়ের জন্য ফলব্যাক -> ইউনিকোড। দেখা হলে, enc2xs-এর জন্য এই অক্ষর যোগ করে
শুধুমাত্র মানচিত্র ডিকোড করুন।

· এবং সবশেষে, CHARMAP এর শেষ অংশটি শেষ করে।

আপনি যখন ম্যানুয়ালি একটি UCM ফাইল তৈরি করছেন, তখন আপনাকে ascii.ucm বা বিদ্যমান একটি অনুলিপি করা উচিত
এনকোডিং যা আপনার কাছাকাছি, বরং স্ক্র্যাচ থেকে আপনার নিজের লিখুন।

আপনি যখন তা করবেন, নিশ্চিত করুন যে আপনি অন্তত চলে যান U0000 থেকে U0020 যেমন আছে, যদি না আপনার পরিবেশ
EBCDIC হয়।

ক্যাভিট: UCM এর সমস্ত বৈশিষ্ট্য বাস্তবায়িত হয় না। উদাহরণস্বরূপ, icu:state ব্যবহার করা হয় না।
সেই কারণে, আপনি যদি অ্যালগরিদমিক্যাল সমর্থন করতে চান তবে আপনাকে একটি পার্ল মডিউল লিখতে হবে
এনকোডিং, বিশেষ করে ISO-2022 সিরিজ। এই ধরনের মডিউলগুলির মধ্যে রয়েছে Encode::JP::2022_JP,
এনকোড::KR::2022_KR, এবং এনকোড::TW::HZ।

প্রাচীরশীর্ষস্থ ঢাল সঙ্গে নকল ম্যাপিংস
আপনি যখন একটি মানচিত্র তৈরি করেন, তখন আপনার ম্যাপিংগুলিকে রাউন্ড-ট্রিপ নিরাপদ করা উচিত৷ এটাই,
"এনকোড('আপনার-এনকোডিং', ডিকোড('আপনার-এনকোডিং', $ডেটা)) eq $data" মানে সব
"|0" হিসাবে চিহ্নিত অক্ষর। এখানে কিভাবে নিশ্চিত করা যায়:

· ইউনিকোড ক্রমে আপনার মানচিত্র সাজান।

আপনার যখন একটি ডুপ্লিকেট এন্ট্রি থাকে, তখন '|1' বা '|3' দিয়ে একটি চিহ্নিত করুন।

এবং নিশ্চিত করুন যে '|1' বা '|3' এন্ট্রিটি '|0' এন্ট্রি অনুসরণ করছে।

এখানে big5-eten থেকে একটি উদাহরণ.

\xF2550\xF9 |9
\xA2550\xA2 |4

অভ্যন্তরীণ এনকোডিং -> ইউনিকোড এবং ইউনিকোড -> এনকোডিং ম্যাপ দেখতে এইরকম;

E থেকে U U থেকে E
--------------------------------------
\xF9\xF9 => U2550 U2550 => \xF9\xF9
\xA2\xA4 => U2550

তাই এটি রাউন্ড-ট্রিপ \xF9\xF9 এর জন্য নিরাপদ। কিন্তু উপরের লাইন যদি উল্টো হয়, এখানে কি আছে
ঘটবে।

E থেকে U U থেকে E
--------------------------------------
\xA2\xA4 => U2550 U2550 => \xF9\xF9
(\xF9\xF9 => U2550 এখন ওভাররাইট করা হয়েছে!)

এনকোড প্যাকেজ এর সাথে আসে ucmlint, একটি অশোধিত কিন্তু পর্যাপ্ত ইউটিলিটি চেক করতে
একটি UCM ফাইলের অখণ্ডতা। এটির জন্য এনকোড/বিন ডিরেক্টরির অধীনে চেক করুন।

সন্দেহ হলে, আপনি ব্যবহার করতে পারেন ucmsort, Encode/bin ডিরেক্টরির অধীনে আরেকটি ইউটিলিটি।

বুকমার্ক


· ICU হোম পেজ <http://www.icu-project.org/>

· ICU ক্যারেক্টার ম্যাপিং টেবিল <http://site.icu-project.org/charts/charset>

· ICU: রূপান্তর ডেটা <http://www.icu-project.org/userguide/conversion-data.html>

onworks.net পরিষেবা ব্যবহার করে অনলাইনে enc2xs ব্যবহার করুন


বিনামূল্যে সার্ভার এবং ওয়ার্কস্টেশন

উইন্ডোজ এবং লিনাক্স অ্যাপ ডাউনলোড করুন

  • 1
    Eclipse Tomcat প্লাগইন
    Eclipse Tomcat প্লাগইন
    Eclipse Tomcat প্লাগইন প্রদান করে
    একটি টমক্যাট সার্লেটের সহজ ইন্টিগ্রেশন
    জাভা বিকাশের জন্য ধারক
    ওয়েব অ্যাপ্লিকেশন। আপনি জন্য আমাদের সাথে যোগ দিতে পারেন
    আলোচনা...
    Eclipse Tomcat প্লাগইন ডাউনলোড করুন
  • 2
    ওয়েব টরেন্ট ডেস্কটপ
    ওয়েব টরেন্ট ডেস্কটপ
    ওয়েবটরেন্ট ডেস্কটপ স্ট্রিমিংয়ের জন্য
    ম্যাক, উইন্ডোজ বা লিনাক্সে টরেন্ট। এটা
    BitTorrent এবং উভয়ের সাথে সংযোগ করে
    WebTorrent সহকর্মীরা। এখন নেই
    অপেক্ষা করতে হবে...
    ওয়েবটরেন্ট ডেস্কটপ ডাউনলোড করুন
  • 3
    জেনএক্স
    জেনএক্স
    GenX পরিমার্জিত করার জন্য একটি বৈজ্ঞানিক প্রোগ্রাম
    এক্স-রে রিফেলসিটিভিটি, নিউট্রন
    প্রতিফলন এবং পৃষ্ঠের এক্স-রে
    ডিফার্যাকশন ডেটা ডিফারেনশিয়াল ব্যবহার করে
    বিবর্তন অ্যালগরিদম...
    GenX ডাউনলোড করুন
  • 4
    pspp4 উইন্ডোজ
    pspp4 উইন্ডোজ
    PSPP হল পরিসংখ্যান সংক্রান্ত একটি প্রোগ্রাম
    নমুনা তথ্য বিশ্লেষণ। এটি একটি বিনামূল্যে
    মালিকানা প্রোগ্রামের জন্য প্রতিস্থাপন
    এসপিএসএস। PSPP-তে পাঠ্য-ভিত্তিক এবং উভয়ই রয়েছে
    গ্রাফিক্যাল আমাদের...
    pspp4windows ডাউনলোড করুন
  • 5
    গিট এক্সটেনশন
    গিট এক্সটেনশন
    গিট এক্সটেনশন হল একটি স্বতন্ত্র UI টুল
    গিট সংগ্রহস্থল পরিচালনার জন্য। এটাও
    উইন্ডোজ এক্সপ্লোরারের সাথে সংহত করে এবং
    মাইক্রোসফ্ট ভিসুয়াল স্টু
    (2015/2017/2019)। ম...
    গিট এক্সটেনশন ডাউনলোড করুন
  • 6
    ইস্পেক: বক্তৃতা সংশ্লেষ
    ইস্পেক: বক্তৃতা সংশ্লেষ
    ইংরেজির জন্য টেক্সট টু স্পিচ ইঞ্জিন এবং
    অন্যান্য অনেক ভাষা। সঙ্গে কম্প্যাক্ট আকার
    স্পষ্ট কিন্তু কৃত্রিম উচ্চারণ।
    এর সাথে একটি কমান্ড-লাইন প্রোগ্রাম হিসাবে উপলব্ধ
    অনেক...
    eSpeak ডাউনলোড করুন: বক্তৃতা সংশ্লেষণ
  • আরও »

লিনাক্স কমান্ডগুলি

Ad