यह SVoice (स्पीच वॉयस सेपरेशन) नाम का एक विंडोज़ ऐप है, जिसका नवीनतम संस्करण svoicesourcecode.tar.gz के रूप में डाउनलोड किया जा सकता है। इसे वर्कस्टेशन के लिए मुफ़्त होस्टिंग प्रदाता OnWorks पर ऑनलाइन चलाया जा सकता है।
SVoice (स्पीच वॉयस सेपरेशन) नामक इस ऐप को OnWorks के साथ मुफ्त में डाउनलोड करें और ऑनलाइन चलाएँ।
इस ऐप को चलाने के लिए इन निर्देशों का पालन करें:
- 1. इस एप्लिकेशन को अपने पीसी में डाउनलोड करें।
- 2. हमारे फ़ाइल प्रबंधक में https://www.onworks.net/myfiles.php?username=XXXXX उस उपयोगकर्ता नाम के साथ दर्ज करें जो आप चाहते हैं।
- 3. इस एप्लिकेशन को ऐसे फाइल मैनेजर में अपलोड करें।
- 4. इस वेबसाइट से कोई भी ओएस ऑनवर्क्स ऑनलाइन एमुलेटर शुरू करें, लेकिन बेहतर विंडोज ऑनलाइन एमुलेटर।
- 5. ऑनवर्क्स विंडोज ओएस से आपने अभी शुरुआत की है, हमारे फाइल मैनेजर को https://www.onworks.net/myfiles.php?username=XXXXX उस यूजरनेम के साथ जाएं जो आप चाहते हैं।
- 6. एप्लिकेशन डाउनलोड करें और इसे इंस्टॉल करें।
- 7. अपने Linux वितरण सॉफ़्टवेयर रिपॉजिटरी से वाइन डाउनलोड करें। एक बार इंस्टॉल हो जाने पर, आप ऐप को वाइन के साथ चलाने के लिए डबल-क्लिक कर सकते हैं। आप PlayOnLinux को भी आज़मा सकते हैं, जो वाइन पर एक फैंसी इंटरफ़ेस है जो आपको लोकप्रिय विंडोज़ प्रोग्राम और गेम इंस्टॉल करने में मदद करेगा।
वाइन लिनक्स पर विंडोज सॉफ्टवेयर चलाने का एक तरीका है, लेकिन विंडोज की आवश्यकता नहीं है। वाइन एक ओपन-सोर्स विंडोज संगतता परत है जो किसी भी लिनक्स डेस्कटॉप पर सीधे विंडोज प्रोग्राम चला सकती है। अनिवार्य रूप से, वाइन खरोंच से पर्याप्त विंडोज़ को फिर से लागू करने की कोशिश कर रहा है ताकि वह उन सभी विंडोज़ अनुप्रयोगों को वास्तव में विंडोज़ की आवश्यकता के बिना चला सके।
स्क्रीनशॉट:
एसवॉयस (भाषण आवाज पृथक्करण)
विवरण:
SVoice, स्पीकर वॉइस सेपरेशन पर फेसबुक रिसर्च के अध्ययन का PyTorch-आधारित कार्यान्वयन है, जैसा कि "अनजान संख्या में कई स्पीकर्स के साथ वॉइस सेपरेशन" पेपर में वर्णित है। यह परियोजना एक गहन शिक्षण ढाँचा प्रस्तुत करती है जो मिश्रित ऑडियो अनुक्रमों को अलग करने में सक्षम है जहाँ कई लोग एक साथ बोलते हैं, बिना यह जाने कि कितने स्पीकर्स मौजूद हैं। यह मॉडल आवर्तक प्रसंस्करण ब्लॉकों के साथ गेटेड न्यूरल नेटवर्क का उपयोग करता है जो आउटपुट चैनलों में स्पीकर की एकरूपता बनाए रखते हुए, कई कम्प्यूटेशनल चरणों में आवाज़ों को अलग करते हैं। अलग-अलग मॉडल अलग-अलग स्पीकर संख्याओं के लिए प्रशिक्षित किए जाते हैं, और सबसे बड़ी क्षमता वाला मॉडल गतिशील रूप से मिश्रण में स्पीकर्स की वास्तविक संख्या निर्धारित करता है। रिपॉजिटरी में प्रशिक्षण, डेटासेट तैयारी, वितरित प्रशिक्षण, मूल्यांकन और ऑडियो सेपरेशन के लिए सभी आवश्यक स्क्रिप्ट शामिल हैं।
विशेषताएं
- अज्ञात वक्ता संख्या के साथ वाक् पृथक्करण के लिए एंड-टू-एंड PyTorch कार्यान्वयन
- मजबूत मल्टी-स्पीकर मॉडलिंग के लिए गेटेड RNN ब्लॉक और कन्वोल्यूशनल एनकोडर का उपयोग करता है
- स्वचालित चेकपॉइंटिंग और प्रयोग प्रबंधन के साथ हाइड्रा के माध्यम से कॉन्फ़िगर करने योग्य
- वितरित बहु-GPU प्रशिक्षण और आसान डेटासेट कॉन्फ़िगरेशन का समर्थन करता है
- इसमें शोर और प्रतिध्वनि सिंथेटिक मिश्रणों के लिए डेटासेट निर्माण उपकरण शामिल हैं
- भाषण नमूनों को अलग करने और स्कोर करने के लिए अंतर्निहित मूल्यांकन और अनुमान उपकरण
प्रोग्रामिंग भाषा
पायथन, यूनिक्स शैल
श्रेणियाँ
यह एक ऐसा एप्लिकेशन है जिसे https://sourceforge.net/projects/svoice.mirror/ से भी प्राप्त किया जा सकता है। इसे हमारे किसी भी निःशुल्क ऑपरेटिव सिस्टम से सबसे आसान तरीके से ऑनलाइन चलाने के लिए OnWorks में होस्ट किया गया है।