This is the Linux app named SVoice (Speech Voice Separation) whose latest release can be downloaded as svoicesourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
Muat turun dan jalankan dalam talian apl bernama SVoice ini (Pemisahan Suara Pertuturan) dengan OnWorks secara percuma.
Ikut arahan ini untuk menjalankan apl ini:
- 1. Memuat turun aplikasi ini dalam PC anda.
- 2. Masukkan dalam pengurus fail kami https://www.onworks.net/myfiles.php?username=XXXXX dengan nama pengguna yang anda mahukan.
- 3. Muat naik aplikasi ini dalam pengurus filem tersebut.
- 4. Mulakan OnWorks Linux dalam talian atau emulator dalam talian Windows atau emulator dalam talian MACOS dari tapak web ini.
- 5. Daripada OS Linux OnWorks yang baru anda mulakan, pergi ke pengurus fail kami https://www.onworks.net/myfiles.php?username=XXXX dengan nama pengguna yang anda mahukan.
- 6. Muat turun aplikasi, pasang dan jalankan.
SKRIN
Ad
SVoice (Pemisahan Suara Pertuturan)
DESCRIPTION
Svoice ialah pelaksanaan berasaskan PyTorch bagi kajian Facebook Research tentang pemisahan suara pembesar suara seperti yang diterangkan dalam makalah "Pemisahan Suara dengan Bilangan Berbilang Pembesar Suara yang Tidak Diketahui." Projek ini membentangkan rangka kerja pembelajaran mendalam yang mampu memisahkan jujukan audio bercampur di mana beberapa orang bercakap serentak, tanpa pengetahuan awal tentang bilangan pembesar suara yang hadir. Model ini menggunakan rangkaian saraf berpagar dengan blok pemprosesan berulang yang merungkai suara melalui berbilang langkah pengiraan, sambil mengekalkan konsistensi pembesar suara merentas saluran keluaran. Model berasingan dilatih untuk kiraan pembesar suara yang berbeza, dan model kapasiti terbesar secara dinamik menentukan bilangan sebenar pembesar suara dalam campuran. Repositori termasuk semua skrip yang diperlukan untuk latihan, penyediaan set data, latihan yang diedarkan, penilaian dan pemisahan audio.
Ciri-ciri
- Pelaksanaan PyTorch hujung ke hujung untuk pemisahan pertuturan dengan kiraan pembesar suara yang tidak diketahui
- Menggunakan blok RNN berpagar dan pengekod konvolusi untuk pemodelan berbilang pembesar suara yang mantap
- Boleh dikonfigurasikan melalui Hydra dengan pemeriksaan automatik dan pengurusan percubaan
- Menyokong latihan berbilang GPU yang diedarkan dan konfigurasi set data yang mudah
- Termasuk alat penjanaan set data untuk campuran sintetik yang bising dan bergema
- Alat penilaian dan inferens terbina dalam untuk mengasingkan dan menskor sampel pertuturan
Bahasa Pengaturcaraan
Python, Unix Shell
Kategori
Ini adalah aplikasi yang juga boleh diambil dari https://sourceforge.net/projects/svoice.mirror/. Ia telah dihoskan dalam OnWorks untuk dijalankan dalam talian dengan cara yang paling mudah daripada salah satu Sistem Operasi percuma kami.