This is the Linux app named SVoice (Speech Voice Separation) whose latest release can be downloaded as svoicesourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
Pobierz i uruchom bezpłatnie w Internecie aplikację o nazwie SVoice (Speech Voice Separation) z OnWorks.
Postępuj zgodnie z tymi instrukcjami, aby uruchomić tę aplikację:
- 1. Pobrałem tę aplikację na swój komputer.
- 2. Wpisz w naszym menedżerze plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.
- 3. Prześlij tę aplikację w takim menedżerze plików.
- 4. Uruchom emulator online OnWorks Linux lub Windows online lub emulator online MACOS z tej witryny.
- 5. W systemie operacyjnym OnWorks Linux, który właśnie uruchomiłeś, przejdź do naszego menedżera plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.
- 6. Pobierz aplikację, zainstaluj ją i uruchom.
ZRZUTY EKRANU
Ad
SVoice (rozdzielenie głosu od mowy)
OPIS
SVoice to oparta na platformie PyTorch implementacja badania Facebook Research nad separacją głosów mówców, opisanego w artykule „Voice Separation with an Unknown Number of Multiple Speakers”. Projekt ten prezentuje platformę głębokiego uczenia umożliwiającą separację mieszanych sekwencji audio, w których kilka osób mówi jednocześnie, bez wcześniejszej wiedzy o liczbie mówców. Model wykorzystuje bramkowane sieci neuronowe z rekurencyjnymi blokami przetwarzania, które rozdzielają głosy w wielu krokach obliczeniowych, zachowując jednocześnie spójność mówców w różnych kanałach wyjściowych. Osobne modele są trenowane dla różnej liczby mówców, a model o największej pojemności dynamicznie określa rzeczywistą liczbę mówców w miksie. Repozytorium zawiera wszystkie niezbędne skrypty do trenowania, przygotowania zbioru danych, trenowania rozproszonego, ewaluacji i separacji dźwięku.
Funkcjonalności
- Kompleksowa implementacja PyTorch do separacji mowy przy nieznanej liczbie mówców
- Wykorzystuje bramkowane bloki RNN i kodery splotowe do solidnego modelowania wielu głośników
- Możliwość konfiguracji za pomocą Hydry z automatycznym tworzeniem punktów kontrolnych i zarządzaniem eksperymentami
- Obsługuje rozproszone szkolenie wieloprocesorowe i łatwą konfigurację zestawu danych
- Zawiera narzędzia do generowania zbiorów danych dla zaszumionych i pogłosowych mieszanek syntetycznych
- Wbudowane narzędzia oceny i wnioskowania do oddzielania i punktowania próbek mowy
Język programowania
Python, powłoka uniksowa
Kategorie
Tę aplikację można również pobrać ze strony https://sourceforge.net/projects/svoice.mirror/. Została ona umieszczona w OnWorks, aby można ją było uruchomić online w najłatwiejszy sposób z jednego z naszych darmowych systemów operacyjnych.
