এটি VALL-E নামে একটি উইন্ডোজ অ্যাপ যার সর্বশেষ রিলিজটি GreatlyimprovedaccuracyandFixGPUmemoryincreaseduringtraining.zip হিসাবে ডাউনলোড করা যেতে পারে। এটি ওয়ার্কস্টেশনের জন্য বিনামূল্যের হোস্টিং প্রদানকারী OnWorks-এ অনলাইনে চালানো যেতে পারে।
VALL-E নামের এই অ্যাপটি বিনামূল্যে OnWorks সহ অনলাইনে ডাউনলোড করুন এবং চালান৷
এই অ্যাপটি চালানোর জন্য এই নির্দেশাবলী অনুসরণ করুন:
- 1. আপনার পিসিতে এই অ্যাপ্লিকেশনটি ডাউনলোড করুন৷
- 2. আমাদের ফাইল ম্যানেজারে প্রবেশ করুন https://www.onworks.net/myfiles.php?username=XXXXX আপনি যে ইউজারনেম চান।
- 3. এই ধরনের ফাইল ম্যানেজারে এই অ্যাপ্লিকেশনটি আপলোড করুন।
- 4. এই ওয়েবসাইট থেকে যেকোনো OS OnWorks অনলাইন এমুলেটর শুরু করুন, তবে আরও ভালো উইন্ডোজ অনলাইন এমুলেটর।
- 5. OnWorks Windows OS থেকে আপনি এইমাত্র শুরু করেছেন, আমাদের ফাইল ম্যানেজারে যান https://www.onworks.net/myfiles.php?username=XXXXX আপনার পছন্দের ব্যবহারকারীর নাম সহ।
- 6. অ্যাপ্লিকেশনটি ডাউনলোড করুন এবং এটি ইনস্টল করুন।
- 7. আপনার লিনাক্স ডিস্ট্রিবিউশন সফ্টওয়্যার সংগ্রহস্থল থেকে ওয়াইন ডাউনলোড করুন। একবার ইনস্টল হয়ে গেলে, আপনি ওয়াইন দিয়ে চালানোর জন্য অ্যাপটিতে ডাবল-ক্লিক করতে পারেন। এছাড়াও আপনি PlayOnLinux ব্যবহার করে দেখতে পারেন, ওয়াইনের উপর একটি অভিনব ইন্টারফেস যা আপনাকে জনপ্রিয় উইন্ডোজ প্রোগ্রাম এবং গেম ইনস্টল করতে সাহায্য করবে।
ওয়াইন লিনাক্সে উইন্ডোজ সফ্টওয়্যার চালানোর একটি উপায়, কিন্তু কোন উইন্ডোজ প্রয়োজন নেই। ওয়াইন হল একটি ওপেন সোর্স উইন্ডোজ সামঞ্জস্যপূর্ণ স্তর যা সরাসরি যেকোনো লিনাক্স ডেস্কটপে উইন্ডোজ প্রোগ্রাম চালাতে পারে। মূলত, ওয়াইন স্ক্র্যাচ থেকে পর্যাপ্ত উইন্ডোজ পুনরায় প্রয়োগ করার চেষ্টা করছে যাতে এটি আসলে উইন্ডোজের প্রয়োজন ছাড়াই সেই সমস্ত উইন্ডোজ অ্যাপ্লিকেশন চালাতে পারে।
স্ক্রীনশটগুলি
Ad
উপত্যকা
বর্ণনাঃ
আমরা টেক্সট টু স্পিচ সিনথেসিস (TTS) এর জন্য একটি ভাষা মডেলিং পদ্ধতি প্রবর্তন করি। বিশেষত, আমরা একটি অফ-দ্য-শেল্ফ নিউরাল অডিও কোডেক মডেল থেকে প্রাপ্ত বিযুক্ত কোড ব্যবহার করে একটি নিউরাল কোডেক ল্যাঙ্গুয়েজ মডেল (যাকে VALL-E বলা হয়) প্রশিক্ষণ দিই, এবং আগের কাজের মতো অবিচ্ছিন্ন সিগন্যাল রিগ্রেশনের পরিবর্তে TTSকে একটি শর্তসাপেক্ষ ভাষা মডেলিং কাজ হিসাবে বিবেচনা করি। প্রাক-প্রশিক্ষণ পর্যায়ে, আমরা TTS প্রশিক্ষণের ডেটা 60K ঘন্টার ইংরেজি বক্তৃতায় স্কেল করি যা বিদ্যমান সিস্টেমের তুলনায় শতগুণ বড়। VALL-E ইন-প্রেক্ষাপটে শেখার ক্ষমতার আবির্ভাব হয় এবং একটি শাব্দ প্রম্পট হিসাবে একটি অদেখা স্পিকারের শুধুমাত্র 3-সেকেন্ডের নথিভুক্ত রেকর্ডিং সহ উচ্চ-মানের ব্যক্তিগতকৃত বক্তৃতা সংশ্লেষ করতে ব্যবহার করা যেতে পারে। পরীক্ষার ফলাফল দেখায় যে VALL-E উল্লেখযোগ্যভাবে অত্যাধুনিক জিরো-শট টিটিএস সিস্টেমকে বক্তৃতা স্বাভাবিকতা এবং স্পিকারের মিলের ক্ষেত্রে ছাড়িয়ে গেছে। উপরন্তু, আমরা দেখতে পাই VALL-E সংশ্লেষণে স্পিকারের আবেগ এবং অ্যাকোস্টিক প্রম্পটের শাব্দিক পরিবেশ সংরক্ষণ করতে পারে।
বৈশিষ্ট্য
- VALL-E-এর পাইপলাইন হল ফোনেম → বিযুক্ত কোড → তরঙ্গরূপ
- VALL-E ফোনমে এবং অ্যাকোস্টিক কোড প্রম্পটের উপর ভিত্তি করে পৃথক অডিও কোডেক কোড তৈরি করে
- VALL-E সরাসরি বিভিন্ন বক্তৃতা সংশ্লেষণ অ্যাপ্লিকেশন সক্ষম করে
- জিরো-শট টিটিএস, বক্তৃতা সম্পাদনা, এবং বিষয়বস্তু তৈরি
- GPT-3 এর মতো অন্যান্য জেনারেটিভ এআই মডেলের সাথে মিলিত
- VALL-E স্পিকার প্রম্পটের অ্যাকোস্টিক পরিবেশ বজায় রেখে ব্যক্তিগতকৃত বক্তৃতা সংশ্লেষ করতে পারে
প্রোগ্রামিং ভাষা
পাইথন
বিভাগ
এটি একটি অ্যাপ্লিকেশন যা https://sourceforge.net/projects/vall-e.mirror/ থেকেও আনা যেতে পারে। আমাদের বিনামূল্যের অপারেটিভ সিস্টেমগুলির মধ্যে একটি থেকে সবচেয়ে সহজ উপায়ে অনলাইনে চালানোর জন্য এটি OnWorks-এ হোস্ট করা হয়েছে।

