This is the Linux app named SVoice (Speech Voice Separation) whose latest release can be downloaded as svoicesourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
SVoice (Konuşma Ses Ayrımı) adlı bu uygulamayı OnWorks ile ücretsiz olarak çevrimiçi indirin ve çalıştırın.
Bu uygulamayı çalıştırmak için şu talimatları izleyin:
- 1. Bu uygulamayı PC'nize indirdiniz.
- 2. Dosya yöneticimize https://www.onworks.net/myfiles.php?username=XXXXX istediğiniz kullanıcı adını girin.
- 3. Bu uygulamayı böyle bir dosya yöneticisine yükleyin.
- 4. Bu web sitesinden OnWorks Linux çevrimiçi veya Windows çevrimiçi öykünücüsünü veya MACOS çevrimiçi öykünücüsünü başlatın.
- 5. Yeni başladığınız OnWorks Linux işletim sisteminden, istediğiniz kullanıcı adıyla https://www.onworks.net/myfiles.php?username=XXXXX dosya yöneticimize gidin.
- 6. Uygulamayı indirin, kurun ve çalıştırın.
EKRAN
Ad
SVoice (Konuşma Sesi Ayrımı)
AÇIKLAMA
SVoice, Facebook Research'ün "Bilinmeyen Sayıda Birden Fazla Konuşmacıyla Ses Ayrımı" makalesinde açıklanan konuşmacı ses ayrımı üzerine çalışmasının PyTorch tabanlı bir uygulamasıdır. Bu proje, önceden kaç konuşmacının bulunduğu bilinmeden, birden fazla kişinin aynı anda konuştuğu karma ses dizilerini ayırabilen bir derin öğrenme çerçevesi sunmaktadır. Model, çıkış kanalları arasında konuşmacı tutarlılığını korurken, birden fazla hesaplama adımında sesleri birbirinden ayıran tekrarlayan işlem bloklarına sahip kapılı sinir ağları kullanır. Farklı konuşmacı sayıları için ayrı modeller eğitilir ve en yüksek kapasiteli model, bir karışımdaki gerçek konuşmacı sayısını dinamik olarak belirler. Veri havuzu, eğitim, veri seti hazırlama, dağıtılmış eğitim, değerlendirme ve ses ayrımı için gerekli tüm betikleri içerir.
Özellikler
- Bilinmeyen konuşmacı sayılarıyla konuşma ayrımı için uçtan uca PyTorch uygulaması
- Sağlam çok konuşmacılı modelleme için kapılı RNN blokları ve evrişimli kodlayıcılar kullanır
- Otomatik kontrol noktası ve deney yönetimi ile Hydra üzerinden yapılandırılabilir
- Dağıtılmış çoklu GPU eğitimini ve kolay veri kümesi yapılandırmasını destekler
- Gürültülü ve yankılanan sentetik karışımlar için veri kümesi oluşturma araçlarını içerir
- Konuşma örneklerini ayırmak ve puanlamak için yerleşik değerlendirme ve çıkarım araçları
Programlama dili
Python, Unix Kabuğu
Kategoriler
Bu uygulama, https://sourceforge.net/projects/svoice.mirror/ adresinden de indirilebilir. Ücretsiz İşletim Sistemlerimizden birinden çevrimiçi olarak en kolay şekilde çalıştırılabilmesi için OnWorks'te barındırılmıştır.
