ইংরেজিফরাসিস্প্যানিশ

সার্ভার চালান | Ubuntu > | Fedora > |


অনওয়ার্কস ফেভিকন

জুলিয়াস - ক্লাউডে অনলাইন

উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটরের মাধ্যমে OnWorks ফ্রি হোস্টিং প্রদানকারীতে জুলিয়াস চালান

এটি হল জুলিয়াস কমান্ড যা আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে OnWorks ফ্রি হোস্টিং প্রদানকারীতে চালানো যেতে পারে।

কার্যক্রম:

NAME এর


জুলিয়াস
- ওপেন সোর্স মাল্টি-পারপাস LVCSR ইঞ্জিন

সাইনোপিসিস


জুলিয়াস [-সি jconfile] [অপশন...]

বর্ণনাঃ


জুলিয়াস এর জন্য একটি উচ্চ-কর্মক্ষমতা, বহু-উদ্দেশ্য, ওপেন-সোর্স স্পিচ রিকগনিশন ইঞ্জিন
গবেষক এবং বিকাশকারীরা। এটি প্রায় রিয়েল-টাইম স্বীকৃতি সম্পাদন করতে সক্ষম
60k-শব্দের বেশি 3-গ্রাম ভাষার মডেল এবং ট্রাইফোন এইচএমএম মডেল সহ অবিচ্ছিন্ন বক্তৃতা, বেশিরভাগ ক্ষেত্রে
বর্তমান পিসি। জুলিয়াস অডিও ফাইল, লাইভ মাইক্রোফোন ইনপুটে স্বীকৃতি সঞ্চালন করতে পারে,
নেটওয়ার্ক ইনপুট এবং বৈশিষ্ট্য পরামিতি ফাইল.

মূল স্বীকৃতি মডিউলটি "জুলিয়াসলিব" নামক সি লাইব্রেরি হিসাবে প্রয়োগ করা হয়। এটাও হতে পারে
প্লাগ-ইন সুবিধা দ্বারা প্রসারিত।

সমর্থিত মডেল
জুলিয়াস বক্তৃতা শনাক্তকারী হিসাবে চালানোর জন্য একটি ভাষা মডেল এবং একটি শাব্দিক মডেল প্রয়োজন৷ জুলিয়াস
নিম্নলিখিত মডেল সমর্থন করে।

শাব্দ মডেল
HTK ascii ফরম্যাটে সাব-ওয়ার্ড HMM (Hidden Markov Model) সমর্থিত। ফোনমে
মডেল (মনোফোন), প্রসঙ্গ নির্ভর ফোনমি মডেল (ট্রাইফোন), বাঁধা-মিশ্রণ এবং
যে কোনো ইউনিটের ফোনেটিক বাঁধা-মিশ্রণ মডেল ব্যবহার করা যেতে পারে। প্রসঙ্গ নির্ভর ব্যবহার করার সময়
মডেল, আন্তঃশব্দ প্রসঙ্গ নির্ভরতাও পরিচালনা করা হয়। মাল্টি-স্ট্রিম বৈশিষ্ট্য এবং
MSD-HMM এছাড়াও সমর্থিত. আপনি আরও একটি টুল ব্যবহার করতে পারেন mkbinhmm ascii রূপান্তর করতে
দ্রুত লোড করার জন্য একটি কমপ্যাক্ট বাইনারি বিন্যাসে HMM ফাইল।

মনে রাখবেন যে জুলিয়াস নিজেই কেবল বক্তৃতা ডেটা থেকে MFCC বৈশিষ্ট্যগুলি বের করতে পারে। ব্যবহার করলে
শাব্দ HMM অন্যান্য বৈশিষ্ট্যের জন্য প্রশিক্ষিত, আপনাকে HTK প্যারামিটারে ইনপুট দিতে হবে
একই বৈশিষ্ট্য ধরনের ফাইল।

ভাষা মডেল: শব্দ এন-গ্রাম
শব্দ এন-গ্রাম ভাষার মডেল, 10-গ্রাম পর্যন্ত, সমর্থিত। জুলিয়াস বিভিন্ন ব্যবহার করে
প্রতিটি পাসের জন্য এন-গ্রাম: প্রথম পাসে বাম থেকে ডানে 2-গ্রাম এবং ডান-থেকে-বামে এন-গ্রাম
২য় পাস। জুলিয়াসের জন্য LR 2-গ্রাম এবং RL N-গ্রাম উভয়ই ব্যবহার করার পরামর্শ দেওয়া হয়।
যাইহোক, আপনি শুধুমাত্র একক LR N-gram বা RL N-গ্রাম ব্যবহার করতে পারেন। এই ধরনের ক্ষেত্রে, আনুমানিক
প্রদত্ত এন-গ্রাম থেকে গণনা করা এলআর 2-গ্রাম প্রথম পাসে প্রয়োগ করা হবে।

স্ট্যান্ডার্ড ARPA ফর্ম্যাট সমর্থিত। উপরন্তু, একটি বাইনারি বিন্যাস এছাড়াও
দক্ষতার জন্য সমর্থিত। যন্ত্রটি mkbingram(1) ARPA ফরম্যাট N-gram-এ রূপান্তর করতে পারে
বাইনারি বিন্যাস।

ভাষা মডেল: ব্যাকরণ
ব্যাকরণ বিন্যাস একটি আসল, এবং একটি স্বীকৃতি ব্যাকরণ তৈরি করার জন্য সরঞ্জাম
বিতরণ অন্তর্ভুক্ত করা হয়. একটি ব্যাকরণ দুটি ফাইল নিয়ে গঠিত: একটি হল a
'ব্যাকরণ' ফাইল যা একটি BNF শৈলীতে বাক্য গঠন বর্ণনা করে, শব্দ ব্যবহার করে
'বিভাগ' নামটি সমাপ্ত চিহ্ন হিসাবে। আরেকটি হল 'ভোকা' ফাইল যা শব্দকে সংজ্ঞায়িত করে
প্রতিটি বিভাগের জন্য এর উচ্চারণ (অর্থাৎ ফোনমি সিকোয়েন্স) সহ। তাদের উচিত
দ্বারা রূপান্তরিত mkdfa(1) একটি নির্ধারক সসীম অটোমেটন ফাইল (.dfa) এবং একটি
অভিধান ফাইল (.dict), যথাক্রমে। আপনি একাধিক ব্যাকরণও ব্যবহার করতে পারেন।

ভাষা মডেল: ভিন্ন শব্দ
আপনি শুধুমাত্র শব্দ অভিধান ব্যবহার করে বিচ্ছিন্ন শব্দ শনাক্ত করতে পারেন। এর সাথে
মডেলের ধরন, জুলিয়াস স্ট্যাটিক প্রসঙ্গ সহ দ্রুত এক পাস স্বীকৃতি সম্পাদন করবে
হ্যান্ডলিং নীরবতা মডেল প্রতিটি শব্দ মাথা এবং পুচ্ছ উভয় যোগ করা হবে. তুমি পারবে
এছাড়াও একটি প্রক্রিয়ায় একাধিক অভিধান ব্যবহার করুন।

অনুসন্ধান অ্যালগরিদম
এর স্বীকৃতি অ্যালগরিদম জুলিয়াস একটি দুই পাস কৌশল উপর ভিত্তি করে. শব্দ 2-গ্রাম এবং বিপরীত
3-গ্রাম শব্দটি সংশ্লিষ্ট পাসগুলিতে ব্যবহৃত হয়। সম্পূর্ণ ইনপুট প্রথমটিতে প্রক্রিয়া করা হয়
পাস করুন, এবং আবার ইনপুটের জন্য চূড়ান্ত অনুসন্ধান প্রক্রিয়াটি আবার সঞ্চালিত হয়, ব্যবহার করে
অনুসন্ধানের স্থান সংকুচিত করতে প্রথম পাসের ফলাফল। বিশেষ করে, স্বীকৃতি
অ্যালগরিদম বাম-থেকে-ডান-এর সাথে মিলিত একটি ট্রি-ট্রেলিস হিউরিস্টিক অনুসন্ধানের উপর ভিত্তি করে
ফ্রেম-সিঙ্ক্রোনাস বিম অনুসন্ধান এবং ডান-থেকে-বামে স্ট্যাক ডিকোডিং অনুসন্ধান।

প্রসঙ্গ নির্ভর ফোন (ট্রাইফোন) ব্যবহার করার সময়, ইন্টারওয়ার্ড প্রসঙ্গগুলি নেওয়া হয়
বিবেচনা বাঁধা-মিশ্রণ এবং ফোনেটিক বাঁধা-মিশ্রণ মডেলের জন্য, উচ্চ গতির শাব্দ
গাউসিয়ান ছাঁটাই ব্যবহার করে সম্ভাব্যতা গণনা করা সম্ভব।

আরো বিস্তারিত জানার জন্য, সম্পর্কিত নথি দেখুন.

বিকল্প


এই বিকল্পগুলি মডেল, সিস্টেম আচরণ এবং বিভিন্ন অনুসন্ধান পরামিতি নির্দিষ্ট করে
জুলিয়াস। এই বিকল্পগুলি কমান্ড লাইনে সেট করা যেতে পারে, তবে এটি আপনাকে লিখতে সুপারিশ করা হয়
এগুলিকে একটি পাঠ্য ফাইলে একটি "jconf ফাইল" হিসাবে, এবং "-C" বিকল্প দ্বারা নির্দিষ্ট করুন।

JuliusLib অন্তর্ভুক্ত অ্যাপ্লিকেশনগুলি মূলের পরামিতি সেট করতে এই বিকল্পগুলি ব্যবহার করে
স্বীকৃতি ইঞ্জিন। উদাহরণস্বরূপ, একটি jconf ফাইল কল করে enine এ লোড করা যেতে পারে
j_config_load_file_new() আর্গুমেন্ট হিসাবে jconf ফাইলের নাম দিয়ে।

দয়া করে মনে রাখবেন যে jconf ফাইলের আপেক্ষিক পাথগুলি jconf ফাইলের সাথে আপেক্ষিক হওয়া উচিত
নিজেই, বর্তমান কার্যকারী ডিরেক্টরি নয়।

নীচে গ্রুপ দ্বারা সংগৃহীত সমস্ত বিকল্পের বিশদ বিবরণ রয়েছে।

জুলিয়াস আবেদন পছন্দ
এগুলি JuliusLib এর বাইরে জুলিয়াসের অ্যাপ্লিকেশন বিকল্প। এতে প্যারামিটার রয়েছে এবং
ফলাফল আউটপুট, অক্ষর সেট রূপান্তর, লগ স্তর, এবং মডিউল মোড বিকল্পগুলির জন্য সুইচ করে।
এই বিকল্পগুলি জুলিয়াসের জন্য নির্দিষ্ট, এবং JuliusLib ব্যবহার করে অ্যাপ্লিকেশনগুলিতে ব্যবহার করা যাবে না
জুলিয়াস ছাড়া অন্য।

-আউটফাইল
ফাইল ইনপুটে, এই বিকল্পটি প্রতিটি ফাইলের স্বীকৃতির ফলাফল আলাদা করে লিখুন
ফাইল একটি ইনপুট ফাইলের আউটপুট ফাইল একই নামের হবে কিন্তু প্রত্যয় হবে
".out" এ পরিবর্তিত হয়েছে। (রিভ.4.0)

- পৃথক স্কোর
ভাষা এবং শাব্দিক স্কোর আলাদাভাবে আউটপুট করুন।

-কলব্যাকডিবাগ
ডিবাগের জন্য প্রতিটি কলে কলব্যাকের নাম প্রিন্ট করুন। (রিভ.4.0)

-চারকনভ থেকে থেকে
অক্ষর সেট রূপান্তর সঙ্গে মুদ্রণ. থেকে উৎস অক্ষর সেট ব্যবহৃত হয়
ভাষা মডেল, এবং থেকে লক্ষ্য অক্ষর সেট আপনি পেতে চান.

লিনাক্সে, আর্গুমেন্টগুলি একটি কোড নাম হওয়া উচিত। আপনি উপলব্ধ তালিকা পেতে পারেন
"iconv --list" কমান্ডের মাধ্যমে কোড নাম। উইন্ডোজে, আর্গুমেন্ট হওয়া উচিত
একটি কোড নাম বা কোডপৃষ্ঠা নম্বর। কোডের নাম হতে হবে "ansi", "mac", "oem" এর মধ্যে একটি।
"utf-7", "utf-8", "sjis", "euc"। অথবা আপনি সমর্থিত যেকোন কোডপেজ নম্বর উল্লেখ করতে পারেন
আপনার পরিবেশ।

-nocharconv
অক্ষর রূপান্তর অক্ষম করুন।

-মডিউল [বন্দর]
"সার্ভার মডিউল মোডে" জুলিয়াস চালান। স্টার্টআপের পরে, জুলিয়াস tcp/ip সংযোগের জন্য অপেক্ষা করে
ক্লায়েন্ট থেকে। সংযোগ স্থাপন হয়ে গেলে, জুলিয়াস ক্লায়েন্টের সাথে যোগাযোগ শুরু করে
ক্লায়েন্ট থেকে ইনকামিং কমান্ড প্রক্রিয়া করতে, অথবা আউটপুট স্বীকৃতি ফলাফল, ইনপুট
ক্লায়েন্টের কাছে তথ্য এবং অন্যান্য সিস্টেমের অবস্থা ট্রিগার করুন। ডিফল্ট পোর্ট নম্বর হল
10500.

-রেকর্ড Dir
নির্দিষ্ট ডিরেক্টরিতে সমস্ত ইনপুট বক্তৃতা ডেটা স্বয়ংক্রিয়ভাবে সংরক্ষণ করুন। প্রতিটি সেগমেন্টেড ইনপুট হয়
একে একে রেকর্ড করা হয়েছে। রেকর্ড করা ডেটার ফাইলের নাম সিস্টেমের সময় থেকে তৈরি করা হয়
যখন ইনপুট শেষ হয়, YYYY.MMDD.HHMMSS.wav এর স্টাইলে। ফাইল বিন্যাস 16 বিট মনোরাল
WAV. mfcfile ইনপুটের জন্য অবৈধ৷

দ্বারা ইনপুট প্রত্যাখ্যান সঙ্গে - সংক্ষিপ্ত প্রত্যাখ্যান, প্রত্যাখ্যান ইনপুট এমনকি যদি রেকর্ড করা হবে
তারা প্রত্যাখ্যাত হয়।

-লগ ফাইল ফাইল
স্ট্যান্ডার্ড আউটপুটের পরিবর্তে একটি ফাইলে সমস্ত লগ আউটপুট সংরক্ষণ করুন। (Rev.4.0)

-নোলগ
সমস্ত লগ আউটপুট অক্ষম করুন। (Rev.4.0)

-হেল্প
আউটপুট সাহায্য বার্তা এবং প্রস্থান করুন.

বিশ্বব্যাপী অপশন
এগুলি হল মডেল-/অনুসন্ধান-নির্ভর বিকল্পগুলি অডিও ইনপুট, শব্দ সনাক্তকরণ, জিএমএম,
ডিকোডিং অ্যালগরিদম, প্লাগইন সুবিধা এবং অন্যান্য। গ্লোবাল অপশন আগে স্থাপন করা উচিত
কোনো উদাহরণ ঘোষণা (-এএম, -এলএম, বা -এসআর), অথবা ঠিক পরে "-গ্লোবাল"বিকল্প।

অডিও ইনপুট
-ইনপুট {mic|rawfile|mfcfile|adinnet|stdin|netaudio|alsa|oss|esd}
স্পিচ ইনপুট সোর্স বেছে নিন। ওয়েভফর্ম ফাইলের জন্য 'ফাইল' বা 'রওফাইল' নির্দিষ্ট করুন,
HTK প্যারামিটার ফাইলের জন্য 'htkparam' বা 'mfcfile'। ফাইল ইনপুট, ব্যবহারকারীদের হবে
stdin থেকে ফাইলের নাম লিখতে বলা হয়েছে, অথবা আপনি ব্যবহার করতে পারেন - ফাইললিস্ট বিকল্প
প্রক্রিয়া করার জন্য ফাইলগুলির তালিকা নির্দিষ্ট করুন।

'মাইক' হল একটি ডিফল্ট লাইভ মাইক্রোফোন ডিভাইস থেকে অডিও ইনপুট পেতে এবং 'অ্যাডিনেট'
একটি অ্যাডিননেট ক্লায়েন্ট থেকে tcpip নেটওয়ার্কের মাধ্যমে ওয়েভফর্ম ডেটা গ্রহণের অর্থ।
'নেটঅডিও' হল DatLink/NetAudio ইনপুট থেকে, এবং 'stdin' মানে ডেটা ইনপুট থেকে
স্ট্যান্ডার্ড ইনপুট।

ওয়েভফর্ম ফাইল ইনপুটের জন্য, শুধুমাত্র WAV (কোনও কম্প্রেশন নেই) এবং RAW (নোহেডার, 16 বিট, বড়
endian) ডিফল্টরূপে সমর্থিত। এর সাথে কম্পাইল করলে অন্য ফরম্যাট পড়া যাবে
libsnd লাইব্রেরি। আসলে কোন ফর্ম্যাটটি সমর্থিত তা দেখতে, সহায়তা বার্তাটি দেখুন
বিকল্প ব্যবহার করে -হেল্প. stdin ইনপুটের জন্য, শুধুমাত্র WAV এবং RAW সমর্থিত। (ডিফল্ট:
mfcfile)

লিনাক্সে, আপনি alsa, oss এবং esd নির্দিষ্ট করে রান টাইমে API বেছে নিতে পারেন।

-খণ্ড_আকার নমুনা
নমুনা সংখ্যা অডিও খণ্ড আকার. (ডিফল্ট: 1000)

- ফাইললিস্ট ফাইলের নাম
(সঙ্গে -ইনপুট rawfile|mfcfile) তালিকাভুক্ত সমস্ত ফাইলে স্বীকৃতি সঞ্চালন
ফাইল ফাইলটিতে প্রতি লাইনে ইনপুট ফাইল থাকা উচিত। ইঞ্জিন সব শেষ হয়ে যাবে
ফাইল প্রক্রিয়া করা হয়.

-নোটাইপচেক
ডিফল্টরূপে, জুলিয়াস ইনপুট পরামিতি টাইপ পরীক্ষা করে যে এটি AM এর সাথে মেলে কিনা
না. এই বিকল্পটি চেক অক্ষম করবে এবং ইনপুট ভেক্টর ব্যবহার করতে ইঞ্জিনকে বাধ্য করবে
যেমনটি

-48
48kHz স্যাম্পলিং সহ ইনপুট রেকর্ড করুন এবং 16kHz অন-দ্য-ফ্লাইতে নামিয়ে নিন। এই
বিকল্পটি শুধুমাত্র 16kHz মডেলের জন্য বৈধ। ডাউন-স্যাম্পলিং রুটিন থেকে পোর্ট করা হয়েছিল
sptk (প্রকাশ. 4.0)

-এনএ ডিভাইসের নাম
DatLink সার্ভার ইনপুট জন্য হোস্ট নাম (-ইনপুট নেটঅডিও).

-এডপোর্ট পোর্ট নাম্বার
সঙ্গে -ইনপুট অ্যাডিননেট, শুনতে অ্যাডিননেট পোর্ট নম্বর উল্লেখ করুন। (ডিফল্ট: 5530)

-নোস্ট্রিপ
জুলিয়াস ডিফল্টভাবে ইনপুট স্পিচ ডেটাতে ধারাবাহিক শূন্য নমুনাগুলি সরিয়ে দেয়। এই
বিকল্প অপসারণ বাধা দেয়।

-জমেন , -নোজমিয়ান
এই বিকল্পটি ইনপুট তরঙ্গরূপের ডিসি অফসেট অপসারণ সক্ষম/অক্ষম করে। অফসেট হবে
পুরো ইনপুট থেকে আনুমানিক। মাইক্রোফোন/নেটওয়ার্ক ইনপুটের জন্য, এর শূন্য গড়
প্রথম 48000 নমুনা (3kHz স্যাম্পলিংয়ে 16 সেকেন্ড) এর জন্য ব্যবহার করা হবে
অনুমান (ডিফল্ট: অক্ষম)

এই বিকল্পটি চ্যানেলের জন্য স্ট্যাটিক অফসেট ব্যবহার করে। আরো দেখুন -zmeansource জন্য
ফ্রেম অনুযায়ী অফসেট অপসারণ.

বক্তৃতা সনাক্তকরণ by স্তর এবং শূন্য-ক্রস
- নিরবতা , - নিঃশব্দতা
লেভেল এবং জিরো-ক্রস দ্বারা স্পিচ ডিটেকশন চালু/বন্ধ করুন। জন্য ডিফল্ট চালু আছে
mic/adinnet ইনপুট, এবং ফাইলের জন্য বন্ধ।

-lv থ্রেস
স্পিচ ইনপুট সনাক্তকরণের জন্য স্তরের থ্রেশহোল্ড। মান 0 থেকে সীমার মধ্যে হওয়া উচিত
32767. (ডিফল্ট: 2000)

-zc থ্রেস
প্রতি সেকেন্ডে জিরো ক্রসিং থ্রেশহোল্ড। শুধুমাত্র ইনপুট যে স্তরের উপর যায়
প্রান্তিক (-lv) গণনা করা হবে। (ডিফল্ট: 60)

-হেড মার্জিন msec
মিলিসেকেন্ডে স্পিচ সেগমেন্টের শুরুতে সাইলেন্স মার্জিন। (ডিফল্ট: 300)

- tailmargin msec
মিলিসেকেন্ডে স্পিচ সেগমেন্টের শেষে সাইলেন্স মার্জিন। (ডিফল্ট: 400)

ইনপুট প্রত্যাখ্যান
ইনপুট দৈর্ঘ্যের উপর ভিত্তি করে দুটি সহজ ফ্রন্ট-এন্ড ইনপুট প্রত্যাখ্যান পদ্ধতি প্রয়োগ করা হয়
এবং সনাক্ত করা অংশের গড় শক্তি। গড় শক্তি দ্বারা প্রত্যাখ্যান হয়
পরীক্ষামূলক, এবং সংকলনে --enable-power-reject দ্বারা সক্ষম করা যেতে পারে। জন্য বৈধ
শুধুমাত্র পাওয়ার সহগ এবং রিয়েল-টাইম ইনপুট সহ MFCC বৈশিষ্ট্য।

GMM-ভিত্তিক ইনপুট প্রত্যাখ্যানের জন্য নীচের GMM বিভাগটি দেখুন।

- সংক্ষিপ্ত প্রত্যাখ্যান msec
নির্দিষ্ট মিলিসেকেন্ডের চেয়ে ছোট ইনপুট প্রত্যাখ্যান করুন। অনুসন্ধান বন্ধ করা হবে এবং
কোন ফলাফল আউটপুট হবে না.

-পাওয়ারথ্রেস থ্রেস
ইনপুট করা অংশটিকে তার গড় শক্তি দ্বারা প্রত্যাখ্যান করুন। গড় শক্তি থাকলে
শেষ স্বীকৃত ইনপুট থ্রেশহোল্ডের নিচে, জুলিয়াস ইনপুট প্রত্যাখ্যান করবে।
(Rev.4.0)

এই বিকল্পটি বৈধ যখন --enable-power-reject কম্পাইলেশনে নির্দিষ্ট করা হয়
সময়।

গসিয়ান মিশ্রণ মডেল / জিএমএম-ভিএডি
সঞ্চিত স্কোর দ্বারা ইনপুট প্রত্যাখ্যানের জন্য বা ফ্রন্ট-এন্ডের জন্য GMM ব্যবহার করা হবে
GMM-ভিত্তিক VAD যখন --enable-gmm-vad নির্দিষ্ট করা হয়।

দ্রষ্টব্য: আপনার জিএমএমের জন্য প্রয়োজনীয় সঠিক MFCC প্যারামিটারগুলিও সেট করা উচিত,
AM বিভাগে বর্ণিত শাব্দ পরামিতি নির্দিষ্ট করা -AM_GMM.

যখন GMM-ভিত্তিক VAD সক্ষম করা হয়, তখন প্রতিটিতে ভয়েস অ্যাক্টিভিটি স্কোর গণনা করা হবে
ফ্রন্ট-এন্ড প্রক্রিয়াকরণ হিসাবে ফ্রেম। মানটিকে \[ \max_{m \in M_v} হিসাবে গণনা করা হবে
p(x|m) - \max_{m \in M_n} p(x|m) \] যেখানে $M_v$ হল ভয়েস GMM-এর একটি সেট এবং $M_n$ হল
গোলমাল GMM এর একটি সেট যার নাম দ্বারা নির্দিষ্ট করা উচিত -gmmreject. কার্যক্রম
তারপর শেষ N ফ্রেমের জন্য স্কোর গড় করা হবে, যেখানে N দ্বারা নির্দিষ্ট করা হয়েছে
-gmmmargin. জুলিয়াস প্রতিটি ফ্রেমে গড় কার্যকলাপ স্কোর আপডেট করে, এবং সনাক্ত করে
স্পিচ আপ-ট্রিগার যখন মানটি নির্দিষ্ট করা মানের থেকে বেশি হয় -gmmup, এবং
detecgt ডাউন-ট্রিগার যখন এটি একটি মানের থেকে কম হয় -gmmdown.

-gmm hmmdefs_file
HTK বিন্যাসে GMM সংজ্ঞা ফাইল। নির্দিষ্ট করা হলে, GMM-ভিত্তিক ইনপুট যাচাইকরণ
1ম পাসের সাথে একযোগে সঞ্চালিত হবে, এবং আপনি ইনপুট প্রত্যাখ্যান করতে পারেন
দ্বারা নির্দিষ্ট ফলাফল অনুযায়ী -gmmreject. GMM হিসাবে সংজ্ঞায়িত করা উচিত
এক-রাষ্ট্রীয় এইচএমএম

-gmmnum সংখ্যা
GMM গণনাতে প্রতি ফ্রেমে গণনা করা গাউসীয় উপাদানের সংখ্যা। কেবল
দ্রুত গণনার জন্য এন-সেরা গাউসিয়ানদের গণনা করা হবে। ডিফল্ট হল 10
এবং ছোট মান নির্দিষ্ট করলে GMM গণনার গতি বাড়বে, কিন্তু খুব ছোট মান
(1 বা 2) শনাক্তকরণ কার্যক্ষমতার অবনতি ঘটাতে পারে।

-gmmreject স্ট্রিং
অবৈধ ইনপুট হিসাবে প্রত্যাখ্যান করা GMM নামের কমা দ্বারা পৃথক করা তালিকা৷ কখন
স্বীকৃতি, সম্পূর্ণ ইনপুট ইচ্ছার জন্য জমে থাকা GMM এর লগ সম্ভাবনা
১ম পাসের সাথে একযোগে গণনা করা হবে। জিএমএম নাম হলে সর্বোচ্চ স্কোর
এই স্ট্রিং এর মধ্যে আছে, 2য় পাস কার্যকর করা হবে না এবং ইনপুট হবে
প্রত্যাখ্যাত.

-gmmmargin ফ্রেম
(GMM_VAD) ফ্রেমে হেড মার্জিন। যখন জিএমএম দ্বারা একটি স্পিচ ট্রিগার সনাক্ত করা হয়,
এই মান বিয়োগ বর্তমান ফ্রেম থেকে স্বীকৃতি শুরু হবে। (Rev.4.0)

এই বিকল্পটি বৈধ হবে শুধুমাত্র যদি --enable-gmm-vad-এর সাথে কম্পাইল করা হয়।

-gmmup মূল্য
(GMM_VAD) ভয়েস অ্যাক্টিভিটি স্কোরের ট্রিগার থ্রেশহোল্ড আপ। (Rev.4.1)

এই বিকল্পটি বৈধ হবে শুধুমাত্র যদি --enable-gmm-vad-এর সাথে কম্পাইল করা হয়।

-gmmdown মূল্য
(GMM_VAD) ভয়েস অ্যাক্টিভিটি স্কোরের ডাউন ট্রিগার থ্রেশহোল্ড। (Rev.4.1)

এই বিকল্পটি বৈধ হবে শুধুমাত্র যদি --enable-gmm-vad-এর সাথে কম্পাইল করা হয়।

পাঠোদ্ধারতা পছন্দ
রিয়েল-টাইম প্রসেসিং মানে এমএফসিসি কম্পিউটেশন ১ম পাসের সমসাময়িক প্রক্রিয়াকরণ
ডিকোডিং ডিফল্টরূপে, মাইক্রোফোনের জন্য পাসে রিয়েল-টাইম প্রক্রিয়াকরণ চালু আছে /
অ্যাডিননেট/নেটঅডিও ইনপুট এবং অন্যদের জন্য।

-প্রকৃত সময় , -নরিয়ালটাইম
প্রথম পাসে স্পষ্টভাবে রিয়েল-টাইম (পাইপ-লাইন) প্রক্রিয়াকরণ চালু/বন্ধ করুন।
ফাইল ইনপুটের জন্য ডিফল্ট বন্ধ এবং মাইক্রোফোন, অ্যাডিননেট এবং নেটঅডিওর জন্য চালু আছে
ইনপুট. এই বিকল্পটি যেভাবে CMN এবং শক্তি স্বাভাবিককরণ সঞ্চালিত হয় তার সাথে সম্পর্কিত:
বন্ধ থাকলে, পুরো ইনপুটের গড় বৈশিষ্ট্য ব্যবহার করে সেগুলি করা হবে। চালু থাকলে, MAP-CMN
এবং রিয়েল-টাইম প্রক্রিয়াকরণ করতে শক্তি স্বাভাবিককরণ।

বিবিধ। অপশন
-C jconfile
এখানে একটি jconf ফাইল লোড করুন। jconffile এর বিষয়বস্তু এটিতে প্রসারিত করা হবে
বিন্দু।

-version
প্রিন্ট সংস্করণ তথ্য স্ট্যান্ডার্ড ত্রুটি, এবং প্রস্থান করুন.

-স্থাপন
প্রিন্ট ইঞ্জিন সেটিং তথ্য স্ট্যান্ডার্ড ত্রুটি, এবং প্রস্থান করুন.

- শান্ত
আউটপুট কম লগ. ফলাফলের জন্য, শুধুমাত্র সেরা শব্দ ক্রম প্রিন্ট করা হবে।

-ডিবাগ
(ডিবাগের জন্য) লগ করার জন্য বিশাল অভ্যন্তরীণ বার্তা এবং ডিবাগ তথ্য আউটপুট।

-চেক {wchmm|trellis|triphone}
ডিবাগের জন্য, ইন্টারেক্টিভ চেক মোডে প্রবেশ করুন।

-plugindir dirlist
প্লাগইন লোড করার জন্য ডিরেক্টরি নির্দিষ্ট করুন। যদি একাধিক ডাইরেকোট্রি বিদ্যমান থাকে, তাহলে তাদের দ্বারা নির্দিষ্ট করুন
কোলন-বিচ্ছিন্ন তালিকা।

দৃষ্টান্ত ঘোষণা জন্য বহু পাঠোদ্ধারতা
নিম্নলিখিত আর্গুমেন্টগুলি ডিফল্ট প্যারামিটার সহ একটি নতুন কনফিগারেশন সেট তৈরি করবে, এবং
এটিতে বর্তমান সেটটি সুইচ করুন। Jconf পরামিতি নির্দিষ্ট করার পরে বিকল্পটি সেট করা হবে
বর্তমান সেট।

মাল্টি-মডেল ডিকোডিং করতে, এই যুক্তিগুলি প্রতিটি মডেলের প্রথমে নির্দিষ্ট করা উচিত
/ বিভিন্ন নামে অনুসন্ধানের উদাহরণ। প্রথম উদাহরণ সংজ্ঞা আগে কোনো বিকল্প
উপেক্ষা করা হবে।

যখন কোন দৃষ্টান্ত সংজ্ঞা পাওয়া যায় না (জুলিয়াসের পুরানো সংস্করণ হিসাবে), সমস্ত বিকল্প
_default নামের একটি ডিফল্ট উদাহরণে বরাদ্দ করা হয়েছে।

দয়া করে মনে রাখবেন যে একটি একক LM এবং একাধিক AM এর সাথে ডিকোডিং সম্পূর্ণরূপে সমর্থিত নয়৷ জন্য
উদাহরণস্বরূপ, আপনি নিম্নলিখিত হিসাবে jconf ফাইলটি তৈরি করতে চাইতে পারেন।
এই ধরনের মডেল শেয়ারিং এখনও সমর্থিত নয়, যেহেতু LM প্রক্রিয়াকরণের কিছু অংশ নির্ভর করে
নির্ধারিত AM উপর. পরিবর্তে, আপনি প্রতিটির জন্য একই LM সংজ্ঞায়িত করে একই ফলাফল পেতে পারেন
AM, এই মত:

-এএম নাম
একটি নতুন AM কনফিগারেশন সেট তৈরি করুন এবং নতুনটিতে কারেন্ট স্যুইচ করুন। আপনি একটি দিতে হবে
অনন্য নাম. (Rev.4.0)

-এলএম নাম
একটি নতুন এলএম কনফিগারেশন সেট তৈরি করুন এবং নতুনটিতে কারেন্ট স্যুইচ করুন। আপনি একটি দিতে হবে
অনন্য নাম. (Rev.4.0)

-এসআর নাম am_name lm_নাম
একটি নতুন অনুসন্ধান কনফিগারেশন সেট তৈরি করুন, এবং বর্তমানকে নতুনটিতে স্যুইচ করুন। উল্লেখিত
এএম এবং এলএম এর জন্য নিয়োগ করা হবে। দ্য am_name এবং lm_নাম নাম বা আইডি হতে পারে
সংখ্যা আপনি একটি অনন্য নাম দিতে হবে. (Rev.4.0)

-AM_GMM
ফ্রন্ট-এন্ড প্রক্রিয়াকরণের জন্য GMM ব্যবহার করার সময়, আপনি GMM-নির্দিষ্ট অ্যাকোস্টিক নির্দিষ্ট করতে পারেন
এই বিকল্পের পর পরামিতি। যদি উল্লেখ না করেন -AM_GMM GMM এর সাথে, GMM করবে
শেষ AM হিসাবে একই প্যারামিটার ভেক্টর ভাগ করুন। বর্তমান AM-এ সুইচ করা হবে
জিএমএম এক, তাই সাধারণ AM কনফিগারেশনের সাথে বিভ্রান্ত না হওয়ার জন্য সতর্ক থাকুন। (Rev.4.0)

-গ্লোবাল
একটি বিশ্বব্যাপী বিভাগ শুরু করুন। যে কোনো উদাহরণের আগে বিশ্বব্যাপী বিকল্পগুলি স্থাপন করা উচিত
ঘোষণা, বা একাধিক মডেল স্বীকৃতির এই বিকল্পের পরে। এই ব্যবহার করা যেতে পারে
একাধিক বার. (Rev.4.1)

- নাক চেক , -বিভাগ পরীক্ষা
মাল্টি-মডেল ডিকোডিং-এ বিকল্প অবস্থান চেক অক্ষম/সক্ষম করুন। সক্রিয় করা হলে,
উদাহরণ ঘোষণার মধ্যে বিকল্পগুলিকে "বিভাগ" এবং শুধুমাত্র অন্তর্গত হিসাবে বিবেচনা করা হয়
অপশন প্রকার লেখা যেতে পারে। উদাহরণস্বরূপ, যখন একটি বিকল্প -এএম নির্দিষ্ট করা হয়েছে, শুধুমাত্র AM
অন্যান্য ঘোষণা না পাওয়া পর্যন্ত বিকল্পের পরে সম্পর্কিত বিকল্প স্থাপন করা যেতে পারে। এছাড়াও,
যে কোনো উদাহরণ ঘোষণার আগে বিশ্বব্যাপী বিকল্পগুলিকে শীর্ষে রাখা উচিত। এই
ডিফল্টরূপে সক্রিয়। (Rev.4.1)

ভাষা মডেল (-এলএম)
এই গোষ্ঠীতে প্রতিটি ভাষার মডেল প্রকারের মডেল সংজ্ঞার বিকল্প রয়েছে। ব্যবহার করার সময়
একাধিক LM, একটি উদাহরণে শুধুমাত্র একটি LM থাকতে পারে।

LM কনফিগারেশনের জন্য শুধুমাত্র এক ধরনের LM নির্দিষ্ট করা যেতে পারে। আপনি যদি মাল্টি ব্যবহার করতে চান
মডেল, আপনি একটি নতুন LM হিসাবে তাদের সংজ্ঞায়িত করা উচিত.

এন-গ্রাম
-d bingram_file
বাইনারি বিন্যাস N-গ্রাম ব্যবহার করুন। একটি ARPA N-gram ফাইলকে জুলিয়াস বাইনারিতে রূপান্তর করা যেতে পারে
mkbingram দ্বারা বিন্যাস।

-এনএলআর arpa_ngram_file
একটি ফরোয়ার্ড, বাম-থেকে-ডানে N-গ্রাম ভাষার মডেল স্ট্যান্ডার্ড ARPA ফর্ম্যাটে। কখন
একটি ফরোয়ার্ড এন-গ্রাম এবং পিছনের এন-গ্রাম উভয়ই নির্দিষ্ট করা হয়েছে, জুলিয়াস এটি ব্যবহার করে
2ম পাসের জন্য 1-গ্রাম ফরোয়ার্ড এবং 2য় পাসের জন্য পিছিয়ে N-গ্রাম।

যেহেতু ARPA ফাইল প্রায়ই বিশাল হয়ে যায় এবং লোড হতে অনেক সময় লাগে, তাই হতে পারে
mkbingram দ্বারা ARPA ফাইলটিকে জুলিয়াস বাইনারি ফরম্যাটে রূপান্তর করা ভাল। মনে রাখবেন যে
যদি উভয় ফরোয়ার্ড এবং পশ্চাৎগামী N-গ্রাম স্বীকৃতির জন্য ব্যবহার করা হয়, তারা একসাথে করবে
একটি একক বাইনারি রূপান্তর করা হবে.

যখন শুধুমাত্র একটি ফরোয়ার্ড এন-গ্রাম এই বিকল্প দ্বারা নির্দিষ্ট করা হয় এবং কোন পশ্চাদগামী N-গ্রাম নেই
দ্বারা নির্দিষ্ট করা হয়েছে -এনআরএল, জুলিয়াস শুধুমাত্র ফরোয়ার্ড এন-গ্রাম দিয়ে স্বীকৃতি দেয়। দ্য
১ম পাস প্রদত্ত এন-গ্রামে ২-গ্রাম এন্ট্রি ব্যবহার করবে এবং ২য় পাস করবে
প্রদত্ত এন-গ্রাম ব্যবহার করুন, সামনের সম্ভাবনাগুলিকে পিছনের দিকে রূপান্তর করে
Bayes নিয়ম দ্বারা সম্ভাব্যতা. (Rev.4.0)

-এনআরএল arpa_ngram_file
স্ট্যান্ডার্ড ARPA বিন্যাসে একটি পশ্চাদপদ, ডান-থেকে-বামে N-গ্রাম ভাষার মডেল। কখন
একটি ফরোয়ার্ড এন-গ্রাম এবং পশ্চাদগামী এন-গ্রাম উভয়ই নির্দিষ্ট করা হয়েছে, জুলিয়াস ফরোয়ার্ড ব্যবহার করে
2ম পাসের জন্য 1-গ্রাম এবং 2য় পাসের জন্য এই পশ্চাৎপদ N-গ্রাম।

যেহেতু ARPA ফাইল প্রায়ই বিশাল হয়ে যায় এবং লোড হতে অনেক সময় লাগে, তাই হতে পারে
mkbingram দ্বারা ARPA ফাইলটিকে জুলিয়াস বাইনারি ফরম্যাটে রূপান্তর করা ভাল। মনে রাখবেন যে
যদি উভয় ফরোয়ার্ড এবং পশ্চাৎগামী N-গ্রাম স্বীকৃতির জন্য ব্যবহার করা হয়, তারা একসাথে করবে
একটি একক বাইনারি রূপান্তর করা হবে.

যখন শুধুমাত্র একটি পশ্চাদগামী N-গ্রাম এই বিকল্প দ্বারা নির্দিষ্ট করা হয় এবং কোন ফরোয়ার্ড N-গ্রাম নেই
দ্বারা নির্দিষ্ট করা হয়েছে -এনএলআর, জুলিয়াস শুধুমাত্র পশ্চাৎপদ N-গ্রামের সাথে স্বীকৃতি সঞ্চালন করে।
1ম পাস ফরোয়ার্ড 2-গ্রাম সম্ভাব্যতা পিছিয়ে থেকে গণনা করবে
Bayes নিয়ম ব্যবহার করে 2-গ্রাম। ২য় পাস সম্পূর্ণরূপে প্রদত্ত পশ্চাদগামী এন-গ্রাম ব্যবহার করে।
(Rev.4.0)

-v dict_file
শব্দ অভিধান ফাইল।

-সিলহেড শব্দ_স্ট্রিং -সিলটেল শব্দ_স্ট্রিং
অভিধানে সংজ্ঞায়িত নীরবতা শব্দ, শুরুতে নীরবতার জন্য
বাক্য এবং বাক্যের শেষ। (ডিফল্ট: " "," ")

-মপাঙ্ক শব্দ_স্ট্রিং
অজানা শব্দ উল্লেখ করুন। ডিফল্ট হল " "বা" এটি বরাদ্দ করতে ব্যবহার করা হবে৷
অজানা শব্দের উপর শব্দ সম্ভাবনা, অর্থাত্ অভিধানে যে শব্দগুলি নেই
এন-গ্রাম শব্দভাণ্ডার।

-আইডব্লিউএসপিওয়ার্ড
অভিধানে একটি শব্দ এন্ট্রি যোগ করুন যা আন্তঃশব্দ বিরতির সাথে মিল থাকা উচিত।
এটি কিছু ভাষা মডেলে স্বীকৃতির নির্ভুলতা উন্নত করতে পারে যার নেই
সুস্পষ্ট আন্তঃশব্দ বিরতি মডেলিং। যোগ করা শব্দ এন্ট্রি দ্বারা পরিবর্তন করা যেতে পারে
-ইউস্পেনট্রি.

-ইউস্পেনট্রি word_entry_string
শব্দ এন্ট্রি যে দ্বারা যোগ করা হবে নির্দিষ্ট করুন -আইডব্লিউএসপিওয়ার্ড. (ডিফল্ট: " [sp] sp
sp")

-সেপনাম সংখ্যা
উচ্চ কম্পাঙ্কের শব্দের সংখ্যা সহজ করার জন্য, অভিধান ট্রি থেকে আলাদা করতে হবে
আনুমানিক ত্রুটি যা 1 তারিখে এক-উত্তম আনুমানিকতার কারণে হতে পারে
পাস (ডিফল্ট: 150)

ব্যাকরণ
একাধিক ব্যাকরণ পুনরাবৃত্তি করে নির্দিষ্ট করা যেতে পারে -গ্রাম এবং -গ্রামলিস্ট। এটি নোট করুন
অন্যান্য বিকল্প থেকে অস্বাভাবিক আচরণ (সাধারণ জুলিয়াস বিকল্পে, শেষ একটি হবে
পূর্ববর্তীগুলিকে ওভাররাইড করুন)। তুমি ব্যবহার করতে পার -নোগ্রাম ইতিমধ্যে ব্যাকরণ পুনরায় সেট করতে
পয়েন্টের আগে উল্লেখ করা হয়েছে।

-গ্রাম gramprefix1[,gramprefix2[,gramprefix3,...]]
কমা দ্বারা পৃথক করা ব্যাকরণের তালিকা ব্যবহার করা হবে। যুক্তি একটি উপসর্গ হতে হবে
একটি ব্যাকরণ, অর্থাৎ যদি আপনার থাকে foo.dfa এবং foo.dict, আপনি একটি সঙ্গে তাদের নির্দিষ্ট করা উচিত
একক যুক্তি foo. একাধিক ব্যাকরণ এক সময়ে নির্দিষ্ট করা যেতে পারে a
কমা দ্বারা পৃথক করা তালিকা।

-গ্রামলিস্ট list_file
একটি ব্যাকরণ তালিকা ফাইল নির্দিষ্ট করুন যাতে ব্যাকরণের তালিকা ব্যবহার করা হয়। ক্রমতালিকা
ফাইলে প্রতিটি লাইনে ব্যাকরণের উপসর্গ থাকা উচিত। মধ্যে একটি আপেক্ষিক পথ
তালিকা ফাইলটিকে ফাইলের সাথে আপেক্ষিক হিসাবে বিবেচনা করা হবে, বর্তমান পাথ নয় বা
কনফিগারেশন ফাইল.

-dfa dfa_file -v dict_file
ব্যাকরণ ফাইল আলাদাভাবে নির্দিষ্ট করার একটি পুরানো উপায়। এটা জাল, এবং উচিত নয়
আরো ব্যবহার করা হবে।

-নোগ্রাম
ইতিমধ্যেই নির্দিষ্ট করা ব্যাকরণের বর্তমান তালিকাটি সরান -গ্রাম, -গ্রামলিস্ট, -dfa
এবং -v.

ভিন্ন শব্দ
অভিধান ব্যবহার করে নির্দিষ্ট করা যেতে পারে -w এবং -wlist. যখন আপনি একাধিক নির্দিষ্ট করেন
বার, তাদের সব প্রারম্ভে পড়া হবে. তুমি ব্যবহার করতে পার -নোগ্রাম পুনরায় সেট করতে
সেই সময়ে ইতিমধ্যেই নির্দিষ্ট অভিধান।

-w dict_file
বিচ্ছিন্ন শব্দ স্বীকৃতির জন্য শব্দ অভিধান। ফাইল বিন্যাস অন্যান্য হিসাবে একই
এলএম (Rev.4.0)

-wlist list_file
একটি অভিধান তালিকা ফাইল নির্দিষ্ট করুন যাতে ব্যবহার করা অভিধানগুলির তালিকা রয়েছে।
তালিকা ফাইলে অভিধানের ফাইলের নাম থাকা উচিত, প্রতিটি লাইনে। ক
তালিকা ফাইলের আপেক্ষিক পথটিকে তালিকা ফাইলের সাথে আপেক্ষিক হিসাবে গণ্য করা হবে, নয়
বর্তমান পাথ বা কনফিগারেশন ফাইল। (Rev.4.0)

-নোগ্রাম
ইতিমধ্যেই নির্দিষ্ট করা অভিধানের বর্তমান তালিকাটি সরান -w এবং -wlist.

-উসিল head_sil_model_name tail_sil_model_name sil_context_name
বিচ্ছিন্ন শব্দ স্বীকৃতিতে, নীরবতা মডেলগুলি মাথায় যুক্ত করা হবে এবং
স্বীকৃতিতে প্রতিটি শব্দের লেজ। এই বিকল্পটি নীরবতার মডেলগুলিকে নির্দিষ্ট করে
সংযুক্ত sil_context_name হেড সিল মডেল এবং লেজ সিল মডেলের নাম
শব্দ হেড ফোন এবং টেইল ফোনের প্রসঙ্গ হিসাবে। উদাহরণস্বরূপ, যদি আপনি উল্লেখ করেন
-wsil silB silE sp, ফোন ক্রম b eh t সহ একটি শব্দ silB হিসাবে অনুবাদ করা হবে
sp-b+eh b-eh+t eh-t+sp silE. (Rev.4.0)

ব্যবহারকারী সংজ্ঞায়িত LM
-ব্যবহারকারী
প্রোগ্রামে ব্যবহারকারীর LM ফাংশন ব্যবহার করার ঘোষণা করুন। এই বিকল্পটি নির্দিষ্ট করা উচিত
যদি আপনি ব্যবহারকারী-সংজ্ঞায়িত LM ফাংশন ব্যবহার করেন। (Rev.4.0)

বিবিধ। LM অপশন
- জোরপূর্বক
অভিধানে ভুল শব্দগুলি এড়িয়ে যান এবং জোর করে চলুন।

শাব্দ মডেল এবং বৈশিষ্ট্য বিশ্লেষণ (-এএম) (-AM_GMM)
এই বিভাগে শাব্দ মডেল, বৈশিষ্ট্য নিষ্কাশন, বৈশিষ্ট্য জন্য বিকল্প সম্পর্কে
স্বাভাবিককরণ এবং বর্ণালী বিয়োগ।

-AM নামের পরে, একটি শাব্দ মডেল এবং সম্পর্কিত স্পেসিফিকেশন লিখতে হবে। তুমি ব্যবহার করতে পার
একাধিক AMs বিভিন্ন MFCC প্রকারের সাথে প্রশিক্ষিত। GMM এর জন্য, প্রয়োজনীয় প্যারামিটার শর্ত
পরে AMs হিসাবে ঠিক একইভাবে নির্দিষ্ট করা উচিত -AM_GMM.

একাধিক AM ব্যবহার করার সময়, এর মান -smpপিরিয়ড, -smpFreq, -fsize এবং -fshift হতে হবে
সব AMs মধ্যে একই.

শাব্দ এইচএমএম
-h hmmdef_file
শাব্দ HMM সংজ্ঞা ফাইল। এটি HTK ascii ফর্ম্যাটে বা জুলিয়াস বাইনারি হওয়া উচিত৷
বিন্যাস আপনি mkbinhmm ব্যবহার করে HTK ascii বিন্যাসকে জুলিয়াস বাইনারি বিন্যাসে রূপান্তর করতে পারেন।

- তালিকা hmmlist_file
ফোন ম্যাপিংয়ের জন্য HMMList ফাইল। এই ফাইলটি যৌক্তিক মধ্যে ম্যাপিং প্রদান করে
অভিধানে তৈরি ট্রাইফোন নাম এবং hmmdefs-এ সংজ্ঞায়িত HMM নাম।
এই বিকল্পটি প্রসঙ্গ-নির্ভর মডেলের জন্য নির্দিষ্ট করা উচিত।

-টিমিক্স সংখ্যা
একটি মিশ্রণ কোডবুকে গণনা করার জন্য শীর্ষ গাউসিয়ানদের সংখ্যা উল্লেখ করুন।
ছোট সংখ্যা শাব্দ গণনা গতি বাড়াবে, কিন্তু AM নির্ভুলতা পেতে পারে
খুব ছোট মান সঙ্গে খারাপ. আরো দেখুন -জিপ্রুন. (ডিফল্ট: 2)

-এসপি মডেল নাম
HMM মডেলের নাম নির্দিষ্ট করুন যা একটি উচ্চারণে সংক্ষিপ্ত বিরতির সাথে সম্পর্কিত। দ্য
শর্ট-পজ মডেল নাম স্বীকৃতিতে ব্যবহার করা হবে: শর্ট-পজ স্কিপিং অন
ব্যাকরণ স্বীকৃতি, শব্দ-শেষ সংক্ষিপ্ত বিরতি মডেল সন্নিবেশ সঙ্গে -আইডব্লিউএসপি এন-গ্রামে,
অথবা সংক্ষিপ্ত বিরাম বিভাজন (-বিভাগ) (ডিফল্ট: "sp")

-মাল্টিপাথ
মাল্টি-পাথ মোড সক্ষম করুন। ডিকোডিং দ্রুত করতে, জুলিয়াস ডিফল্টভাবে চাপিয়ে a
এইচএমএম ট্রানজিশনের সীমা যেখানে প্রতিটি মডেল থেকে শুধুমাত্র একটি ট্রানজিশন থাকা উচিত
প্রাথমিক অবস্থা এবং শেষ অবস্থা। মাল্টি-পাথ মোডে, জুলিয়াস অতিরিক্ত হ্যান্ডলিং করে
আন্তঃ-মডেল ট্রানজিশনের জন্য মডেল-এড়িয়ে যাওয়া ট্রানজিশন এবং একাধিক
আউটপুট/ইনপুট ট্রানজিশন। মনে রাখবেন যে এই বিকল্পটি উল্লেখ করলে জুলিয়াস a
বিট ধীর, এবং বৃহত্তর মরীচি প্রস্থ প্রয়োজন হতে পারে.

এই ফাংশনটি জুলিয়াস 3.x-এ একটি সংকলন-সময় বিকল্প ছিল, এবং এখন একটি হয়ে গেছে
রান-টাইম বিকল্প। ডিফল্টরূপে (এই বিকল্পটি ছাড়া), জুলিয়াস রূপান্তর পরীক্ষা করে
নির্দিষ্ট HMM-এর প্রকার, এবং প্রয়োজনে মাল্টি-পাথ মোড সক্রিয় করুন। তুমি পারবে
এই বিকল্পের সাথে মাল্টি-পাথ মোড জোর করুন। (রিভ.4.0)

-জিপ্রুন {নিরাপদ|হিউরিস্টিক|বিম
ব্যবহার করার জন্য গাউসিয়ান প্রুনিং অ্যালগরিদম সেট করুন। বাঁধা মিশ্রণ মডেল জন্য, জুলিয়াস সঞ্চালিত
গাউসিয়ান ছাঁটাই শাব্দ গণনা কমাতে, শুধুমাত্র উপরের N গণনা করে
প্রতিটি ফ্রেমে প্রতিটি কোডবুকে গাউসিয়ানরা। ডিফল্ট সেটিং সেট করা হবে
মডেলের ধরন এবং ইঞ্জিন সেটিং অনুযায়ী। ডিফল্ট মেনে নিতে বাধ্য করবে
ডিফল্ট সেটিং। ছাঁটাই অক্ষম করতে এবং সম্পূর্ণ সম্পাদন করতে এটিকে কোনটিতেই সেট করুন
গণনা নিরাপদ গ্যারান্টি শীর্ষ এন গাউসিয়ানদের গণনা করা হবে। হিউরিস্টিক এবং
মরীচি আরো আক্রমনাত্মক কম্পিউটেশনাল খরচ হ্রাস করতে, কিন্তু ছোট হতে পারে
নির্ভুলতা মডেলের ক্ষতি (ডিফল্ট: নিরাপদ (মানক), বাঁধা মিশ্রণের জন্য মরীচি (দ্রুত)
মডেল, নন টাইড-মিশ্রন মডেলের জন্য)।

-iwcd1 {সর্বোচ্চ|গড়|সেরা সংখ্যা}
একটি শব্দের মাথা এবং লেজে আনুমানিক আন্তঃশব্দ ট্রাইফোনের পদ্ধতি নির্বাচন করুন
প্রথম পাসে।

max একই প্রসঙ্গ ট্রাইফোনের সর্বোচ্চ সম্ভাবনা প্রয়োগ করবে। গড় হবে
একই প্রসঙ্গ ট্রাইফোনের গড় সম্ভাবনা প্রয়োগ করুন। সেরা সংখ্যা হবে
একই প্রসঙ্গ ট্রাইফোনের শীর্ষ এন-সর্বোত্তম সম্ভাবনার গড় প্রয়োগ করুন।

এন-গ্রামের সাথে ব্যবহারের জন্য ডিফল্ট সেরা 3 এবং ব্যাকরণ এবং শব্দের জন্য গড়। কখন এটা
AM উভয় প্রকারের LM দ্বারা ভাগ করা হয়, পরবর্তীটি বেছে নেওয়া হবে।

-আইউএসপেনাল্টি ভাসা
শব্দ-শেষ সংক্ষিপ্ত বিরতির জন্য সন্নিবেশ জরিমানা দ্বারা সংযোজিত -আইডব্লিউএসপি.

-gshmm hmmdef_file
যদি এই বিকল্পটি নির্দিষ্ট করা হয়, জুলিয়াস এর জন্য গাউসিয়ান মিশ্রণ নির্বাচন করে
দক্ষ ডিকোডিং। hmmdefs একটি থেকে উত্পন্ন একটি monophone মডেল হওয়া উচিত
সাধারণ monophone HMM মডেল, mkgshmm ব্যবহার করে।

-gsnum সংখ্যা
GMS-এ, সংশ্লিষ্ট ট্রাইফোন গণনা করার জন্য মনোফোন স্টেটের সংখ্যা উল্লেখ করুন
বিস্তারিত (ডিফল্ট: 24)

বক্তৃতা বিশ্লেষণ
বর্তমান জুলিয়াসে শুধুমাত্র MFCC বৈশিষ্ট্য নিষ্কাশন সমর্থিত। এভাবে চিনতে গিয়ে
ফাইল বা মাইক্রোফোন থেকে একটি ওয়েভফর্ম ইনপুট, AM অবশ্যই MFCC দ্বারা প্রশিক্ষিত হতে হবে। প্যারামিটার
কন্ডিশনটিও ঠিক একইভাবে প্রশিক্ষণের শর্ত হিসাবে সেট করা উচিত
নীচে অপশন।

আপনি যখন HTK প্যারামিটার ফাইলে একটি ইনপুট দেন, তখন আপনি যেকোন পরামিতি প্রকার ব্যবহার করতে পারেন
এএম এই ক্ষেত্রে জুলিয়াস ইনপুট বৈশিষ্ট্য এবং AM ধরনের সম্পর্কে যত্ন না, শুধু
তাদের ভেক্টর ক্রম হিসাবে পড়ুন এবং প্রদত্ত AM এর সাথে মিলান। জুলিয়াস শুধু চেক করে
প্যারামিটারের ধরন একই কিনা। এটি ভাল কাজ না হলে, আপনি নিষ্ক্রিয় করতে পারেন
দ্বারা এই চেকিং -নোটাইপচেক.

জুলিয়াসে, প্যারামিটার প্রকার এবং কোয়ালিফায়ার (HTK-এ TARGETKIND হিসাবে) এবং সংখ্যা
সিপস্ট্রাল প্যারামিটারের (NUMCEPS) বিষয়বস্তু থেকে স্বয়ংক্রিয়ভাবে সেট করা হবে
AM শিরোনাম, তাই আপনাকে বিকল্প দ্বারা তাদের নির্দিষ্ট করতে হবে না।

অন্যান্য পরামিতি ঠিক প্রশিক্ষণ শর্ত হিসাবে একই সেট করা উচিত. আপনি এটিও করতে পারেন
একটি HTK কনফিগার ফাইল দিন যা আপনি জুলিয়াসকে AM প্রশিক্ষণ দিতে ব্যবহার করেছিলেন -htkconf। কখন এটা
বিকল্পটি প্রয়োগ করা হয়, জুলিয়াস কনফিগার ফাইলটি পার্স করবে এবং উপযুক্ত প্যারামিটার সেট করবে।

আপনি ব্যবহার করে একটি বাইনারি HMM ফাইলে সেই বিশ্লেষণ প্যারামিটার সেটিংস আরও এম্বেড করতে পারেন
mkbinhmm.

যদি বিকল্পগুলি বিভিন্ন উপায়ে নির্দিষ্ট করা হয়, তবে সেগুলি নীচের ক্রমে মূল্যায়ন করা হবে।
AM এমবেডেড প্যারামিটার প্রথমে লোড করা হবে যদি থাকে। তারপর, HTK কনফিগারেশন ফাইল
দ্বারা প্রদত্ত -htkconf পার্স করা হবে। যদি একটি মান ইতিমধ্যেই AM এমবেডেড মান দ্বারা সেট করা থাকে, HTK
config তাদের ওভাররাইড করবে। শেষ পর্যন্ত, সরাসরি বিকল্প লোড হবে, যা হবে
ওভাররাইড সেটিংস আগে লোড হয়েছে। মনে রাখবেন, যখন একই বিকল্পগুলি নির্দিষ্ট করা হয়
বেশ কয়েকবার, পরে আগেরটিকে ওভাররাইড করবে, তা ছাড়া -htkconf মূল্যায়ন করা হবে
উপরে বর্ণিত হিসাবে প্রথম।

-smpপিরিয়ড কাল
100 ন্যানোসেকেন্ডের এককে ইনপুট বক্তৃতার নমুনা সময়কাল। নমুনা হার পারেন
এছাড়াও দ্বারা নির্দিষ্ট করা হবে -smpFreq. অনুগ্রহ করে নোট করুন যে ইনপুট ফ্রিকোয়েন্সি হওয়া উচিত
AM এর প্রশিক্ষণের শর্তের সমান সেট করুন। (ডিফল্ট: 625, এর সাথে মিলে যায়
16,000Hz)

এই বিকল্পটি HTK বিকল্প সোর্সরেটের সাথে মিলে যায়। একই মান হতে পারে
এই অপশন দেওয়া.

একাধিক AM ব্যবহার করার সময়, এই মানটি সমস্ত AM-এর মধ্যে একই হওয়া উচিত।

-smpFreq Hz
Hz-এ ইনপুট স্পিচের স্যাম্পলিং ফ্রিকোয়েন্সি সেট করুন। স্যাম্পলিং রেটও হতে পারে
ব্যবহার করে নির্দিষ্ট করা হয়েছে -smpপিরিয়ড. দয়া করে মনে রাখবেন যে এই ফ্রিকোয়েন্সি সমান সেট করা উচিত
এএম-এর প্রশিক্ষণের শর্তে। (ডিফল্ট: 16,000)

একাধিক AM ব্যবহার করার সময়, এই মানটি সমস্ত AM-এর মধ্যে একই হওয়া উচিত।

-fsize নমুনা_সংখ্যা
নমুনার সংখ্যায় জানালার আকার। (ডিফল্ট: 400)

এই বিকল্পটি HTK বিকল্পের সাথে মিলে যায়, তবে মানটি থাকা উচিত
নমুনা (HTK মান / smpPeriod)।

একাধিক AM ব্যবহার করার সময়, এই মানটি সমস্ত AM-এর মধ্যে একই হওয়া উচিত।

-fshift নমুনা_সংখ্যা
নমুনা সংখ্যা ফ্রেম স্থানান্তর. (ডিফল্ট: 160)

এই বিকল্পটি HTK বিকল্প টার্গেটের সাথে সামঞ্জস্যপূর্ণ, কিন্তু মান থাকা উচিত
নমুনা (HTK মান / smpPeriod)।

একাধিক AM ব্যবহার করার সময়, এই মানটি সমস্ত AM-এর মধ্যে একই হওয়া উচিত।

- preemph ভাসা
প্রাক জোর সহগ। (ডিফল্ট: 0.97)

এই বিকল্পটি HTK বিকল্প PREEMCOEF-এর সাথে মিলে যায়। একই মান দেওয়া যেতে পারে
এই বিকল্পে।

-fbank NUM
ফিল্টারব্যাঙ্ক চ্যানেলের সংখ্যা। (ডিফল্ট: 24)

এই বিকল্পটি HTK বিকল্প NUMCHANS-এর সাথে মিলে যায়। একই মান দেওয়া যেতে পারে
এই বিকল্পে। সচেতন থাকুন যে ডিফল্ট মান HTK (22) এর মতো নয়।

-সেপ্লিফ NUM
সেপস্ট্রাল উত্তোলন সহগ। (ডিফল্ট: 22)

এই বিকল্পটি HTK বিকল্প CEPLIFTER-এর সাথে মিলে যায়। একই মান দেওয়া যেতে পারে
এই বিকল্পে।

-কাঁচা , -নরওয়ে
প্রাক জোর দেওয়ার আগে কাঁচা শক্তি ব্যবহার করে সক্ষম/অক্ষম করুন (ডিফল্ট: অক্ষম)

এই বিকল্পটি HTK বিকল্প RAWENERGY-এর সাথে মিলে যায়। সচেতন থাকুন যে ডিফল্ট
মান HTK থেকে আলাদা (HTK তে সক্ষম, জুলিয়াসে অক্ষম)।

-সাধারণ , - অস্বাভাবিক
লগ শক্তি স্বাভাবিককরণ সক্ষম/অক্ষম করুন। লাইভ ইনপুটে, এই স্বাভাবিককরণ হবে
শেষ ইনপুটের গড় থেকে আনুমানিক। (ডিফল্ট: অক্ষম)

এই বিকল্পটি HTK বিকল্প ENORMALISE-এর সাথে মিলে যায়। সচেতন থাকুন যে ডিফল্ট
মান HTK থেকে আলাদা (HTK তে সক্ষম, জুলিয়াসে অক্ষম)।

-এস্কেল float_scale
লগ শক্তি স্বাভাবিক করার সময় লগ শক্তির স্কেলিং ফ্যাক্টর। (ডিফল্ট: 1.0)

এই বিকল্পটি HTK বিকল্প ESCALE-এর সাথে মিলে যায়। সচেতন থাকুন যে ডিফল্ট
মান HTK (0.1) থেকে আলাদা।

- সিলফ্লোর ভাসা
লগ এনার্জি স্বাভাবিক করার সময় ডিবি-তে এনার্জি সাইলেন্স ফ্লোর। (ডিফল্ট: 50.0)

এই বিকল্পটি HTK বিকল্প SILFLOOR-এর সাথে মিলে যায়।

-ডেলউইন ফ্রেম
ফ্রেমের সংখ্যায় ডেল্টা উইন্ডোর আকার। (ডিফল্ট: 2)

এই বিকল্পটি HTK অপশন DELTAWINDOW-এর সাথে মিলে যায়। একই মান হতে পারে
এই অপশন দেওয়া.

- accwin ফ্রেম
ফ্রেমের সংখ্যায় ত্বরণ উইন্ডোর আকার। (ডিফল্ট: 2)

এই বিকল্পটি HTK বিকল্প ACCWINDOW-এর সাথে মিলে যায়। একই মান দেওয়া যেতে পারে
এই বিকল্পে।

- hifreq Hz
MFCC ফিল্টারব্যাঙ্ক গণনার জন্য ব্যান্ড-লিমিটিং সক্ষম করুন: উপরের ফ্রিকোয়েন্সি সেট করুন৷
বিছিন্ন করা. -1 এর মান এটি নিষ্ক্রিয় করবে। (ডিফল্ট: -1)

এই বিকল্পটি HTK বিকল্প HIFREQ-এর সাথে মিলে যায়। একই মান দেওয়া যেতে পারে
এই বিকল্প।

-lofreq Hz
MFCC ফিল্টারব্যাঙ্ক গণনার জন্য ব্যান্ড-লিমিটিং সক্ষম করুন: কম ফ্রিকোয়েন্সি সেট করুন৷
বিছিন্ন করা. -1 এর মান এটি নিষ্ক্রিয় করবে। (ডিফল্ট: -1)

এই বিকল্পটি HTK বিকল্প LOFREQ-এর সাথে মিলে যায়। একই মান দেওয়া যেতে পারে
এই বিকল্প।

-zmeanframe , - nozmeanframe
স্পিচ ইনপুট সহ, এই বিকল্পটি ফ্রেম অনুযায়ী ডিসি অফসেট অপসারণ সক্ষম/অক্ষম করে।
এটি HTK কনফিগারেশন ZMEANSOURCE এর সাথে মিলে যায়। এই একসাথে ব্যবহার করা যাবে না
সঙ্গে -জমেন. (ডিফল্ট: অক্ষম)

- ব্যবহার ক্ষমতা
ফিল্টারব্যাঙ্ক বিশ্লেষণে মাত্রার পরিবর্তে শক্তি ব্যবহার করুন। (ডিফল্ট: অক্ষম)

সাধারণীকরণ
জুলিয়াস ইনপুটগুলির জন্য সেপস্ট্রাল মিন নরমালাইজেশন (সিএমএন) সঞ্চালন করতে পারে। CMN হবে
যখন প্রদত্ত AM CMN এর সাথে প্রশিক্ষিত হয়েছিল তখন সক্রিয় হয় (অর্থাৎ "_Z" কোয়ালিফায়ার আছে
শিরোনাম)।

সেপস্ট্রাল গড় ইনপুট প্রকার অনুযায়ী বিভিন্ন উপায়ে অনুমান করা হবে।
ফাইল ইনপুটে, গড় পুরো ইনপুট থেকে গণনা করা হবে। লাইভ ইনপুট যেমন
মাইক্রোফোন এবং নেটওয়ার্ক ইনপুট হিসাবে, ইনপুটের সেপ্ট্রাল গড় অজানা
শুরু তাই MAP-CMN ব্যবহার করা হবে। MAP-CMN-এ, একটি প্রাথমিক গড় ভেক্টর প্রয়োগ করা হবে
শুরুতে, এবং গড় ভেক্টর এর গড় smeared হবে
ইনপুট যাওয়ার সাথে সাথে ইনপুট ভেক্টর বৃদ্ধি করা। নীচের বিকল্পগুলি এর আচরণ নিয়ন্ত্রণ করতে পারে
MAP-CMN।

-সিভিএন
সেপস্ট্রাল ভ্যারিয়েন্স স্বাভাবিকীকরণ সক্ষম করুন। ফাইল ইনপুটে, সমগ্রের বৈচিত্র
ইনপুট গণনা করা হবে এবং তারপর প্রয়োগ করা হবে। লাইভ মাইক্রোফোন ইনপুটে, এর বৈচিত্র
শেষ ইনপুট প্রয়োগ করা হবে। CVN শুধুমাত্র একটি অডিও ইনপুটের জন্য সমর্থিত।

-ভিটিএলএন আরম্ভ কম কাটা হিকট
ফ্রিকোয়েন্সি ওয়ার্পিং করুন, সাধারণত একটি ভোকাল ট্র্যাক্ট দৈর্ঘ্য স্বাভাবিককরণ (VTLN) এর জন্য।
আর্গুমেন্ট হল ওয়ার্পিং ফ্যাক্টর, হাই ফ্রিকোয়েন্সি কাট-অফ এবং কম ফ্রিকোয়েন্সি। বিছিন্ন করা. তারা
HTK কনফিগার মান, WARPFREQ, WARPCUTOFF এবং WARPLCUTOFF-এর সাথে সামঞ্জস্যপূর্ণ।

-cmnload ফাইল
স্টার্টআপে ফাইল থেকে প্রাথমিক সেপস্ট্রাল গড় ভেক্টর লোড করুন। দ্য ফাইল এক হতে হবে
দ্বারা সংরক্ষিত -cmnsave. একটি প্রাথমিক সেপস্ট্রাল গড় লোড করা জুলিয়াসকে আরও ভাল করতে সক্ষম করে
রিয়েল-টাইম ইনপুটে প্রথম উচ্চারণ চিনুন। যখন একসাথে ব্যবহার করা হয়
-cmnnoupdate, এই প্রাথমিক মানটি সমস্ত ইনপুটের জন্য ব্যবহার করা হবে।

-cmnsave ফাইল
গণনা করা সেপস্ট্রাল গড় ভেক্টর সংরক্ষণ করুন ফাইল. পরামিতি সংরক্ষণ করা হবে
প্রতিটি ইনপুট শেষে। যদি আউটপুট ফাইলটি ইতিমধ্যেই বিদ্যমান থাকে তবে এটি ওভাররাইড করা হবে।

-cmnupdate -cmnnoupdate
রিয়েল-টাইম ইনপুটে প্রতিটি ইনপুটে সেপস্ট্রাল মানে আপডেট করতে হবে কিনা তা নিয়ন্ত্রণ করুন।
এটি নিষ্ক্রিয় করা এবং নির্দিষ্ট করা হচ্ছে -cmnload সর্বদা লোড ব্যবহার করার জন্য ইঞ্জিন তৈরি করবে
স্থির প্রাথমিক সেপস্ট্রাল গড়।

-cmnmapweight ভাসা
MAP-CMN-এর জন্য প্রাথমিক সেপস্ট্রাল গড়ের ওজন নির্দিষ্ট করুন। এর জন্য বড় মান উল্লেখ করুন
একটি দীর্ঘ সময়ের জন্য প্রাথমিক সেপস্ট্রাল গড় ধরে রাখুন, এবং ছোট মান তৈরি করুন
সেপস্ট্রাল মানে বর্তমান ইনপুটের উপর বেশি নির্ভর করে। (ডিফল্ট: 100.0)

সামনে শেষ প্রক্রিয়াজাতকরণ
জুলিয়াস অডিও থেকে কিছু স্থির শব্দ কমাতে বর্ণালী বিয়োগ করতে পারে
ইনপুট. যদিও এটি একটি শক্তিশালী পদ্ধতি নয়, তবে এটি কিছু পরিস্থিতিতে কাজ করতে পারে।
জুলিয়াসের নয়েজ স্পেকট্রাম অনুমান করার দুটি উপায় রয়েছে। একটি উপায় প্রথম যে অনুমান করা হয়
একটি বক্তৃতা ইনপুটের সংক্ষিপ্ত অংশ হল নয়েজ সেগমেন্ট, এবং শব্দ বর্ণালী অনুমান করুন
সেগমেন্টের গড় হিসাবে। আরেকটি উপায় হল থেকে গড় বর্ণালী গণনা করা
অন্য টুল mkss ব্যবহার করে শুধুমাত্র noise-ইনপুট, এবং Julius এ লোড করুন। আগেরটা হল
স্পিচ ফাইল ইনপুটের জন্য জনপ্রিয়, এবং পরবর্তী লাইভ ইনপুটে ব্যবহার করা উচিত। অপশন
নীচের আচরণ পরিবর্তন / নিয়ন্ত্রণ করবে.

-sscalc
নীরবতা অংশ হিসাবে প্রতিটি ফাইলের প্রধান অংশ ব্যবহার করে বর্ণালী বিয়োগ সম্পাদন করুন। দ্য
মাথা অংশ দৈর্ঘ্য দ্বারা নির্দিষ্ট করা উচিত -sscalclen. শুধুমাত্র ফাইল ইনপুট জন্য বৈধ.
সাথে দ্বন্দ্ব -ssload.

-sscalclen msec
সঙ্গে -sscalc, শব্দ বর্ণালী অনুমানের জন্য মাথার নীরবতার দৈর্ঘ্য নির্দিষ্ট করুন
মিলিসেকেন্ডে (ডিফল্ট: 300)

-ssload ফাইল
প্রাক-আনুমানিক শব্দ বর্ণালী ব্যবহার করে বক্তৃতা ইনপুটের জন্য বর্ণালী বিয়োগ সম্পাদন করুন
থেকে লোড ফাইল. নয়েজ স্পেকট্রাম ফাইলটি mkss দ্বারা তৈরি করা যেতে পারে। সকলের জন্য বৈধ
বক্তৃতা ইনপুট। সাথে দ্বন্দ্ব -sscalc.

-সালফা ভাসা
এর জন্য বর্ণালী বিয়োগের আলফা সহগ -sscalc এবং -ssload. গোলমাল হবে
এই মান বৃহত্তর পায় হিসাবে শক্তিশালী বিয়োগ, কিন্তু ফলাফল বিকৃতি
সংকেতও অসাধারণ হয়ে ওঠে। (ডিফল্ট: 2.0)

-ssfloor ভাসা
বর্ণালী বিয়োগের ফ্লোরিং সহগ। বর্ণালী শক্তি যে নীচে যায়
বিয়োগের পর শূন্য এর সাথে উৎস সংকেত দ্বারা প্রতিস্থাপিত হবে
সহগ গুণিত। (ডিফল্ট: 0.5)

বিবিধ। AM অপশন
-htkconf ফাইল
প্রদত্ত HTK কনফিগারেশন ফাইলটি পার্স করুন এবং জুলিয়াসের সাথে সংশ্লিষ্ট প্যারামিটার সেট করুন।
এই বিকল্পটি ব্যবহার করার সময়, ডিফল্ট প্যারামিটার মান জুলিয়াস থেকে সুইচ করা হয়
ডিফল্ট থেকে HTK ডিফল্ট।

স্বীকার প্রক্রিয়া এবং অনুসন্ধান (-এসআর)
এই বিভাগে 1ম / 2য় পাসের অনুসন্ধান পরামিতিগুলির জন্য বিকল্প রয়েছে যেমন মরীচি
প্রস্থ এবং LM ওজন, শর্ট-পজ সেগমেন্টেশনের জন্য কনফিগারেশন, শব্দের জন্য সুইচ
জালি আউটপুট এবং বিভ্রান্তি নেটওয়ার্ক আউটপুট, জোরপূর্বক প্রান্তিককরণ, এবং অন্যান্য বিকল্প সম্পর্কিত
স্বীকৃতি প্রক্রিয়া এবং ফলাফল আউটপুট।

কম্পাইল-টাইম সেটআপ অনুযায়ী বিমের প্রস্থ এবং LM ওজনের ডিফল্ট মান পরিবর্তন হবে
JuliusLib, AM মডেল টাইপ এবং LM আকারের। প্রকৃত জন্য স্টার্টআপ লগ দেখুন
মান।

1st পাস পরামিতি
-এলএমপি ওজন শাস্তি
(N-গ্রাম) প্রথম পাসের জন্য ভাষা মডেল ওজন এবং শব্দ সন্নিবেশ জরিমানা।

-দণ্ড ১ শাস্তি
(ব্যাকরণ) প্রথম পাসের জন্য শব্দ সন্নিবেশ জরিমানা। (ডিফল্ট: 0.0)

-b প্রস্থ
প্রথম পাসে র‌্যাঙ্ক বিমিংয়ের জন্য এইচএমএম নোডের সংখ্যায় বিমের প্রস্থ। এই মান
1ম পাসে অনুসন্ধানের প্রস্থ সংজ্ঞায়িত করে এবং মোটের উপর প্রভাবশালী প্রভাব ফেলে
প্রক্রিয়াকরণের সময়. ছোট প্রস্থ ডিকোডিং গতি বাড়াবে, কিন্তু খুব ছোট মান
অনুসন্ধানের কারণে স্বীকৃতি ত্রুটির একটি উল্লেখযোগ্য বৃদ্ধি হবে
ব্যর্থতা. বৃহত্তর মান অনুসন্ধানকে স্থিতিশীল করে তুলবে এবং ব্যর্থতামুক্ত হবে
অনুসন্ধান, কিন্তু প্রক্রিয়াকরণ সময় প্রস্থ অনুপাতে বৃদ্ধি হবে.

ডিফল্ট মান শাব্দ মডেল প্রকারের উপর নির্ভর করে: 400 (মনোফোন), 800
(ট্রাইফোন), বা 1000 (ট্রাইফোন, সেটআপ=v2.1)

-সীমা NUM
নোড প্রতি টোকেনের উচ্চ সীমা। এই বিকল্পটি বৈধ যখন --enable-wpair এবং
--enable-wpair-nlimit সংকলনের সময় সক্রিয় করা হয়।

-প্রগাউট
প্রথম পাসে আংশিক ফলাফলের প্রগতিশীল আউটপুট সক্ষম করুন।

-proginterval msec
জন্য সময় ব্যবধান সেট করুন -প্রগাউট মিলিসেকেন্ডে (ডিফল্ট: 300)

2nd পাস পরামিতি
-lmp2 ওজন শাস্তি
(N-গ্রাম) ভাষা মডেল ওজন এবং দ্বিতীয় জন্য শব্দ সন্নিবেশ জরিমানা
পাস।

-দণ্ড ১ শাস্তি
(ব্যাকরণ) দ্বিতীয় পাসের জন্য শব্দ সন্নিবেশ জরিমানা। (ডিফল্ট: 0.0)

-বি 2 প্রস্থ
দ্বিতীয় পাসে খামের মরীচির প্রস্থ (অনুমানের সংখ্যা)। যদি গণনা
একটি নির্দিষ্ট হাইপোথিসিস দৈর্ঘ্যে শব্দের বিস্তার অনুসন্ধানের সময় এই সীমাতে পৌঁছে যায়,
সংক্ষিপ্ত অনুমানগুলি আরও প্রসারিত হয় না। এটি অনুসন্ধানে পড়তে বাধা দেয়
প্রস্থ-প্রথম-সদৃশ পরিস্থিতি একই অবস্থানে স্ট্যাকিং, এবং অনুসন্ধান উন্নত করুন
ব্যর্থতা বেশিরভাগই বড় শব্দভান্ডারের অবস্থার জন্য। (ডিফল্ট: 30)

-sb ভাসা
খামযুক্ত স্কোরিংয়ের জন্য স্কোর খামের প্রস্থ। হাইপোথিসিস স্কোর গণনা করার সময়
প্রতিটি উত্পন্ন হাইপোথিসিসের জন্য, এর ট্রেলিস সম্প্রসারণ এবং ভিটারবি অপারেশন হবে
যদি একটি ফ্রেমের স্কোর প্রস্থের নিচে চলে যায় তবে বক্তৃতার মাঝখানে ছাঁটাই করা হবে।
ছোট মান দেওয়া দ্বিতীয় পাস দ্রুত করে তোলে, কিন্তু গণনা ত্রুটি হতে পারে
ঘটবে (ডিফল্ট: 80.0)

-s NUM
স্ট্যাকের আকার, অর্থাৎ হাইপোথিসিসের সর্বাধিক সংখ্যা যা সংরক্ষণ করা যেতে পারে
অনুসন্ধানের সময় স্ট্যাক। একটি বড় মান আরো স্থিতিশীল ফলাফল দিতে পারে, কিন্তু
প্রয়োজনীয় মেমরির পরিমাণ বাড়ায়। (ডিফল্ট: 500)

-m গণনা
অনুসন্ধান বন্ধ করার জন্য প্রয়োজনীয় প্রসারিত অনুমানের সংখ্যা। সংখ্যা হলে
সম্প্রসারিত অনুমানের চেয়ে এই থ্রেশহোল্ডের চেয়ে বেশি, অনুসন্ধান হল
যে সময়ে বন্ধ. এই মান যত বড় হবে, জুলিয়াস তত বেশি সময় পাবে
অনুসন্ধান ছেড়ে দিন। (ডিফল্ট: 2000)

-n NUM
জুলিয়াস প্রার্থীদের সংখ্যা খুঁজে বের করার চেষ্টা করে। এ পর্যন্ত তল্লাশি অব্যাহত রয়েছে
বাক্যের অনুমানের সংখ্যা পাওয়া গেছে। প্রাপ্ত বাক্য অনুমান
স্কোর অনুসারে বাছাই করা হয়, এবং চূড়ান্ত ফলাফল ক্রম অনুসারে প্রদর্শিত হয় (এছাড়াও দেখুন
-আউটপুট) সম্ভাবনা যে সর্বোত্তম অনুমান সঠিকভাবে পাওয়া যায়
এই মান বাড়ার সাথে সাথে বৃদ্ধি পায়, তবে প্রক্রিয়াকরণের সময়ও হয়ে যায়
দীর্ঘ ডিফল্ট মান সংকলনের সময় ইঞ্জিন সেটআপের উপর নির্ভর করে: 10
(মান) বা 1 (দ্রুত বা v2.1)

-আউটপুট NUM
উপরের N বাক্য অনুমান অনুসন্ধান শেষে আউটপুট হবে. সাথে ব্যবহার করো -n
(ডিফল্ট: 1)

-lookuprange ফ্রেম
পরবর্তী শব্দ অনুমানগুলি দেখতে আগে এবং পরে ফ্রেমের সংখ্যা সেট করুন৷
দ্বিতীয় পাসে শব্দ ট্রেলিস। এই সংক্ষিপ্ত শব্দ বাদ দেওয়া প্রতিরোধ করে, কিন্তু
একটি বড় মান সহ, প্রসারিত অনুমানের সংখ্যা বৃদ্ধি পায় এবং সিস্টেম
ধীর হয়ে যায়। (ডিফল্ট: 5)

-লুকট্রেলিস
(ব্যাকরণ) প্রসারিত না করে শুধুমাত্র প্রথম পাসে টিকে থাকা শব্দগুলিকে প্রসারিত করুন
ব্যাকরণ দ্বারা ভবিষ্যদ্বাণী করা সমস্ত শব্দ। এই বিকল্পটি দ্বিতীয় পাস ডিকোডিং করে
দ্রুত, বিশেষ করে বড় শব্দভান্ডারের অবস্থার জন্য, কিন্তু মুছে ফেলার পরিমাণ বাড়িয়ে দিতে পারে
ছোট শব্দের ত্রুটি। (ডিফল্ট: অক্ষম)

সংক্ষিপ্ত বিরতি সেগমেন্টেশন / ডিকোডার-ভিএডি
--enable-decoder-vad-এর সাথে কম্পাইল করা হলে, শর্ট-পজ সেগমেন্টেশন হবে
ডিকোডার-ভিত্তিক VAD সমর্থন করার জন্য প্রসারিত।

-বিভাগ
শর্ট-পজ সেগমেন্টেশন মোড সক্ষম করুন। একটি ছোট বিরতি যখন ইনপুট সেগমেন্ট করা হবে
শব্দ (উচ্চারণে শুধুমাত্র নীরবতা মডেল সহ শব্দ) সর্বাধিক সম্ভাবনা পায়
প্রথম পাসে নির্দিষ্ট ধারাবাহিক ফ্রেমে। যখন সেগমেন্ট শেষ সনাক্ত করা হয়,
জুলিয়াস পয়েন্টে 1ম পাস থামান, 2য় পাস সঞ্চালন করুন এবং পরবর্তী দিয়ে চালিয়ে যান
সেগমেন্ট প্রসঙ্গ শব্দটি সেগমেন্টের মধ্যে বিবেচনা করা হবে। (Rev.4.0)

--enable-decoder-vad-এর সাথে কম্পাইল করা হলে, এই বিকল্পটি ডিকোডার-ভিত্তিক VAD সক্ষম করে,
দীর্ঘ নীরবতা এড়িয়ে যেতে

-spdur ফ্রেম
ফ্রেমের সংখ্যায় ইনপুট সেগমেন্টের শেষ শনাক্ত করতে সংক্ষিপ্ত বিরতি সময়কাল।
(ডিফল্ট: 10)

-পজ মডেল স্ট্রিং
সংক্ষিপ্ত বিরতিতে ব্যবহৃত পজ মডেল নামের একটি কমা দ্বারা পৃথক করা তালিকা
বিভাজন শব্দ যার উচ্চারণ শুধুমাত্র বিরতি মডেল নিয়ে গঠিত
"পজ শব্দ" হিসাবে গণ্য করা হবে এবং বিরতি সনাক্তকরণের জন্য ব্যবহার করা হবে। উল্লেখ না থাকলে,
নাম -এসপি মডেল, -সিলহেড এবং -সিলটেল ব্যবহার করা হবে. (Rev.4.0)

- spmargin ফ্রেম
ডিকোডার-ভিত্তিক VAD-এর জন্য ট্রিগার আপে ব্যাক স্টেপ মার্জিন। যখন বক্তৃতা আপ-ট্রিগার
ডিকোডার-ভিএডি দ্বারা পাওয়া গেছে, জুলিয়াস এই মান দ্বারা ইনপুট প্যারামিটার রিওয়াইন্ড করবে, এবং
বিন্দুতে স্বীকৃতি শুরু করুন। (Rev.4.0)

--enable-decoder-vad-এর সাথে কম্পাইল করা হলেই এই বিকল্পটি বৈধ হবে।

- spdelay ফ্রেম
ডিকোডার-ভিত্তিক VAD-এর জন্য ট্রিগার আপ এ ট্রিগার সিদ্ধান্ত বিলম্ব ফ্রেম। (Rev.4.0)

--enable-decoder-vad-এর সাথে কম্পাইল করা হলেই এই বিকল্পটি বৈধ হবে।

শব্দ জাফরি / বিশৃঙ্খলা নেটওয়ার্ক আউটপুট
-জালি , -নোলাটিস
শব্দ গ্রাফ তৈরি করতে সক্ষম/অক্ষম করুন। অনুসন্ধান অ্যালগরিদম এছাড়াও পরিবর্তিত হয়েছে
আরও ভাল শব্দ গ্রাফ তৈরির জন্য অপ্টিমাইজ করুন, তাই বাক্যের ফলাফল নাও হতে পারে
স্বাভাবিক এন-সর্বোত্তম স্বীকৃতির মতোই। (Rev.4.0)

-কনফনেট , -noconfnet
বিভ্রান্তি নেটওয়ার্কের প্রজন্মকে সক্ষম/অক্ষম করুন। এটি সক্রিয় করাও হবে
সক্রিয় -জালি অভ্যন্তরীণভাবে (Rev.4.0)

-গ্রাফরেঞ্জ ফ্রেম
গ্রাফ জেনারেশনে প্রতিবেশী অবস্থানে একই শব্দ একত্রিত করুন। যদি শুরুর সময়
এবং একই শব্দের দুটি শব্দ প্রার্থীর শেষ সময় নির্দিষ্ট সময়ের মধ্যে
পরিসীমা, তারা একত্রিত করা হবে। ডিফল্ট হল 0 (একই শব্দ মার্জ করার অনুমতি দিন
ঠিক একই অবস্থান) এবং বড় মান উল্লেখ করলে ছোট হবে
গ্রাফ আউটপুট। এই মানটিকে -1 তে সেট করলে তা একত্রিত করা অক্ষম করবে, সেই ক্ষেত্রেও
বিভিন্ন স্কোরের একই অবস্থানের শব্দগুলি যেমন আছে তেমনই রেখে দেওয়া হবে।
(ডিফল্ট: 0)

-গ্রাফকাট গভীরতা
পোস্ট-প্রসেসিং পর্যায়ে এর শব্দ গভীরতা দ্বারা ফলাফল গ্রাফ কাটুন। গভীরতা
মান হল একটি ফ্রেমে অনুমোদিত শব্দের সংখ্যা। -1 সেট করা নিষ্ক্রিয়
এই বৈশিষ্ট্য. (ডিফল্ট: 80)

-গ্রাফবাউন্ডলুপ গণনা
পোস্ট-প্রসেসিং পর্যায়ে সীমানা সমন্বয় লুপের সংখ্যা সীমিত করুন। এই
পরামিতি জুলিয়াসকে সংক্ষেপে অসীম সমন্বয় লুপ দ্বারা ব্লক করা থেকে বাধা দেয়
শব্দ দোলন (ডিফল্ট: 20)

-গ্রাফ অনুসন্ধান বিলম্ব , -নোগ্রাফ অনুসন্ধান বিলম্ব
যখন এই বিকল্পটি সক্রিয় থাকে, তখন জুলিয়াস তার গ্রাফ জেনারেশন অ্যালগরিদম পরিবর্তন করে
2য় পাস প্রথম বাক্য পর্যন্ত গ্রাফ মার্জ করে অনুসন্ধান বন্ধ না করা
প্রার্থী পাওয়া যায়। এই বিকল্পটি গ্রাফের নির্ভুলতা উন্নত করতে পারে, বিশেষ করে যখন আপনি
বিস্তৃত অনুসন্ধান সেট করে একটি বিশাল শব্দ গ্রাফ তৈরি করতে যাচ্ছে। যথা, এটা হতে পারে
আপনি 1ম পাস উভয় ক্ষেত্রেই প্রশস্ত বীম সেট করলে ভাল গ্রাফ নির্ভুলতার ফলাফল -b এবং
২য় পাস -বি 2, এবং এর জন্য বড় সংখ্যা -n. (ডিফল্ট: অক্ষম)

মাল্টি-গ্রাম / মাল্টি-ডিসি স্বীকার
- মাল্টিগ্রামআউট , -nomultigramout
একাধিক ব্যাকরণ ব্যবহার করে ব্যাকরণ স্বীকৃতিতে, জুলিয়াস শুধুমাত্র সেরাটি আউটপুট করবে
সমস্ত ব্যাকরণের মধ্যে ফলাফল। এই বিকল্পটি সক্রিয় করা হলে জুলিয়াস আউটপুটে পরিণত হবে
প্রতিটি ব্যাকরণের ফলাফল। (ডিফল্ট: অক্ষম)

জোরপূর্বক শ্রেণীবিন্যাস
-ওয়ালাইন
স্বীকৃতি ফলাফলের জন্য প্রতি শব্দ ইউনিট প্রতি viterbi প্রান্তিককরণ করবেন. শব্দ
সীমানা ফ্রেম এবং প্রতি ফ্রেমের গড় শাব্দ স্কোর গণনা করা হবে।

-প্যালাইন
স্বীকৃতি ফলাফলের জন্য প্রতি ফোন ইউনিট প্রতি ভিটারবি সারিবদ্ধকরণ করুন। ফোনটি
সীমানা ফ্রেম এবং প্রতি ফ্রেমের গড় শাব্দ স্কোর গণনা করা হবে।

- স্যালাইন
স্বীকৃতি ফলাফলের জন্য প্রতি রাজ্যে ভিটারবি সারিবদ্ধকরণ করুন। রাজ্যের সীমানা
ফ্রেম এবং প্রতি ফ্রেমের গড় শাব্দ স্কোর গণনা করা হবে।

বিবিধ। অনুসন্ধান অপশন
-নিষ্ক্রিয়
নিষ্ক্রিয় অবস্থায় এই স্বীকৃতি প্রক্রিয়ার উদাহরণ শুরু করুন। (Rev.4.0)

-1 পাস
শুধুমাত্র প্রথম পাস সঞ্চালন.

-ফলব্যাক1পাস
যখন ২য় পাস ব্যর্থ হয়, জুলিয়াস কোন ফলাফল ছাড়াই স্বীকৃতি শেষ করে। এই বিকল্প
জুলিয়াসকে বলুন 1ম পাসের ফলাফলকে চূড়ান্ত ফলাফল হিসেবে আউটপুট করতে যখন 2য় পাস হবে
ব্যর্থ হয় মনে রাখবেন কিছু স্কোর আউটপুট (আত্মবিশ্বাস ইত্যাদি) কার্যকর নাও হতে পারে। এই ছিল
Julius-3.x এর ডিফল্ট আচরণ।

-নো_সিসিডি , -force_ccd
অনুসন্ধানে স্পষ্টভাবে ফোনের প্রসঙ্গ হ্যান্ডলিং পরিবর্তন করুন। সাধারণত জুলিয়াস নির্ধারণ করে
AM ব্যবহার করা একটি প্রসঙ্গ-নির্ভর মডেল নাকি মডেলের নাম থেকে নয়,
অর্থাৎ, নামের অক্ষর + এবং - আছে কিনা। এই বিকল্পটি ওভাররাইড করবে
স্বয়ংক্রিয় সনাক্তকরণ।

- cmalpha ভাসা
আত্মবিশ্বাসের স্কোরিংয়ের জন্য মসৃণ প্যারামিটার। (ডিফল্ট: 0.05)

-আইডব্লিউএসপি
(শুধুমাত্র মাল্টি-পাথ মোড) আন্তঃশব্দ প্রসঙ্গ-মুক্ত সংক্ষিপ্ত বিরতি সন্নিবেশ সক্ষম করুন।
এই বিকল্পটি প্রতিটি শব্দের শেষের জন্য একটি এড়ানো যায় এমন সংক্ষিপ্ত বিরতি মডেল যুক্ত করে। দ্য
সংক্ষিপ্ত বিরতি মডেল দ্বারা নির্দিষ্ট করা যেতে পারে -এসপি মডেল.

-ট্রান্সপ ভাসা
স্বচ্ছ শব্দের জন্য অতিরিক্ত সন্নিবেশ জরিমানা। (ডিফল্ট: 0.0)

-ডেমো
সমতুল্য -প্রগাউট - শান্ত.

পরিবেশ বৈচিত্র্য


আলসাদেভ
(alsa ডিভাইসের সাথে মাইক ইনপুট ব্যবহার করে) একটি ক্যাপচার ডিভাইসের নাম উল্লেখ করুন। উল্লেখ না থাকলে,
"ডিফল্ট" ব্যবহার করা হবে।

অডিওদেভ
(oss ডিভাইসের সাথে মাইক ইনপুট ব্যবহার করে) একটি ক্যাপচার ডিভাইস পাথ নির্দিষ্ট করুন। উল্লেখ না থাকলে,
"/dev/dsp" ব্যবহার করা হবে.

LATENCY_MSEC
মাইক্রোফোন ইনপুটের ইনপুট লেটেন্সি মিলিসেকেন্ডে সেট করার চেষ্টা করুন। ছোট মান হবে
বিলম্ব কম করে কিন্তু কখনও কখনও প্রক্রিয়া অস্থির করে তোলে। ডিফল্ট মান উপর নির্ভর করবে
চলমান ওএস।

উদাহরণ


সিস্টেম ব্যবহারের উদাহরণের জন্য, জুলিয়াস নথিতে টিউটোরিয়াল বিভাগটি পড়ুন।

বিজ্ঞপ্তি


jconf ফাইল সম্পর্কে নোট: একটি jconf ফাইলের আপেক্ষিক পাথগুলিকে আপেক্ষিক হিসাবে ব্যাখ্যা করা হয়
jconf ফাইল নিজেই, বর্তমান ডিরেক্টরিতে নয়।

onworks.net পরিষেবা ব্যবহার করে জুলিয়াস অনলাইন ব্যবহার করুন


Ad


Ad