এটি হল সেই কমান্ড swath যা OnWorks ফ্রি হোস্টিং প্রদানকারীতে আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে চালানো যেতে পারে।
কার্যক্রম:
NAME এর
swath - সাধারণ-উদ্দেশ্য থাই শব্দ বিভাজন ইউটিলিটি
সাইনোপিসিস
সোয়াথ [বিকল্প] ইনফাইল > আউটফাইল
বর্ণনাঃ
থাই লিপিতে কোনো শব্দ বিভাজক নেই। অ্যাপ্লিকেশন আগে শব্দ সীমানা চিনতে হবে
তারা থাই টেক্সট দিয়ে দরকারী জিনিস করতে পারে, যেমন লাইন মোড়ানো।
একটি প্রদত্ত টেক্সট স্ট্রীমে শব্দ বিভেদক সন্নিবেশ করার জন্য Swath শব্দ বিশ্লেষণ ফিল্টার প্রদান করে।
এটি স্ট্যান্ডার্ড ইনপুট থেকে পাঠ্য পড়ে, থাইয়ের সাথে পরামর্শ করে শব্দের সীমানাগুলির জন্য এটি বিশ্লেষণ করে
শব্দ তালিকা, এবং আউটপুট থেকে স্ট্যান্ডার্ড আউটপুট একই টেক্সট পূর্বনির্ধারিত শব্দ বিভেদক সহ
.োকানো।
বর্তমানে, এটি প্লেইন টেক্সট, HTML, RTF, LaTeX এবং Lambda (LaTeX এর ইউনিকোড সংস্করণ) পড়তে পারে
ওমেগা টাইপসেটার কার্নেল সহ) নথি এবং প্রতিটি বিন্যাসের জন্য সাধারণ শব্দ বিভাজন সন্নিবেশ করান
(সাধারণ পাঠ্যের জন্য পাইপ `|')। কিন্তু ব্যবহারকারী সর্বদা এটিকে একটি পছন্দের বিভাজনকারী দিয়ে ওভাররাইড করতে পারে।
বিকল্প
-b [সীমাবদ্ধকারী]
আউটপুট টেক্সটে ওয়ার্ড ডিলিমিটর কোড হিসাবে ব্যবহার করার জন্য একটি স্ট্রিং সংজ্ঞায়িত করুন।
-d [dict-পথ]
বিকল্প অভিধান অবস্থান নির্দিষ্ট করুন. dict-পথ একটি ডিরেক্টরি হতে হবে
swath অভিধান ফাইল `swathdic.tri' ধারণ করে, বা অভিধানের একটি পথ
ফাইল নিজেই। অভিধান ফাইলটি ব্যবহার করে প্রস্তুত একটি ট্রাই ফাইল হতে হবে
trietool-0.2(1) libdatrie প্যাকেজ থেকে ইউটিলিটি।
যদি এই বিকল্প দেওয়া হয়, সোয়াথ সাধারণ অভিধান অনুসন্ধান ওভাররাইড করবে এবং প্রস্থান করবে
প্রদত্ত অভিধান খুঁজে না পাওয়ায়। অন্যথায়, যদি SWATHDICT পরিবেশ হয়
সেট, এটি এর মান দ্বারা নির্দিষ্ট অবস্থান থেকে অভিধান খুলতে চেষ্টা করবে।
অন্যথায়, এটি বর্তমান কার্যকারী ডিরেক্টরি এবং অবশেষে স্বাভাবিক চেষ্টা করবে
ইনস্টল করা অবস্থান।
-f [বিন্যাস]
ইনপুট বিন্যাস উল্লেখ করুন. সম্ভাব্য ফরম্যাটগুলি হল: html, rtf, latex, lambda.
-m [পরিকল্পনা]
শব্দের সীমানা বিশ্লেষণ করার সময় শব্দ ম্যাচিং স্কিম চয়ন করুন। সম্ভাব্য স্কিম হয়
'দীর্ঘ' (দীর্ঘতম বা লোভী ম্যাচিংয়ের জন্য) এবং 'সর্বোচ্চ' (সর্বোচ্চ মিলের জন্য, কমপক্ষে
পছন্দের শব্দ)। সর্বোচ্চ মিল হল ডিফল্ট মান।
-u input-enc,আউটপুট-enc
ইনপুট এবং আউটপুটের এনকোডিং নির্দিষ্ট করুন। input-enc এবং আউটপুট-enc 'তু' এর একজন হতে পারে
(UTF-8 এনকোডিংয়ের জন্য) এবং 't' (TIS-620 এনকোডিংয়ের জন্য)। সোয়াথকে কনভার্ট করবে
প্রয়োজনে অক্ষর এনকোডিং। বাদ দেওয়া হলে, ইনপুট এবং উভয় ক্ষেত্রেই TIS-620 এনকোডিং
আউটপুট ধরে নেওয়া হয়।
-ভি, -- ভারবোস
ভার্বোস মোড চালু করুন।
- সাহায্য, --help
সাহায্য দেখান।
পরিবেশ বৈচিত্র্য
SWATHDICT
যদি নির্দিষ্ট করা হয়, সোয়াথ স্বাভাবিকের আগে এই অবস্থানে অভিধান অনুসন্ধান করবে
স্থান (যথাক্রমে বর্তমান কাজের ডিরেক্টরি এবং স্বাভাবিক ইনস্টল ডিরেক্টরি)।
এই মান দ্বারা ওভাররাইড করা হয় -d বিকল্প।
উদাহরণ
LaTeX এর জন্য (ব্যাবেল-থাই প্যাকেজের সাথে ব্যবহার করা হবে):
$ সোয়াথ -f ল্যাটেক্স < thaifile.tex > thaifile.ttex
$ ক্ষীর thaifile.ttex
HTML-এর জন্য (ওয়েব ব্রাউজারগুলিতে ওয়েব পৃষ্ঠাগুলি সরবরাহ করার জন্য যা থাই লাইনগুলি সঠিকভাবে মোড়ানো যায় না, কিন্তু
ট্যাগ সমর্থন করুন):
$ সোয়াথ -f html < myweb.html > myweb-wbr.html
একটি থাই UTF-8 এনকোডেড LaTeX ফাইল টিস620 ইনপুটেঙ্ক সহ বাবেল-থাইয়ের জন্য প্রিপ্রসেস করতে:
$ সোয়াথ -f latex -uu,t < thaifile.tex > thaifile.ttex
$ ক্ষীর thaifile.ttex
এই সঙ্গে ফিল্টারিং সমতুল্য আইকনভি(1):
$ আইকনভি -f UTF-8 -t TIS-620 thaifile.tex | সোয়াথ -f latex > thaifile.ttex
$ ক্ষীর thaifile.ttex
LaTeX নথির সাথে দীর্ঘতম ম্যাচিং স্কিম ব্যবহার করতে:
$ সোয়াথ -f ল্যাটেক্স -m দীর্ঘ < thaifile.tex > thaifile.ttex
$ ক্ষীর thaifile.ttex
লিবথাই থেকে একটি বিকল্প অভিধান ব্যবহার করতে:
$ সোয়াথ -f latex -d /usr/share/libthai/thbrk.tri < thaifile.tex > thaifile.ttex
onworks.net পরিষেবা ব্যবহার করে swath অনলাইন ব্যবহার করুন