Dit is de Windows-app SVoice (Speech Voice Separation), waarvan de nieuwste versie kan worden gedownload als svoicesourcecode.tar.gz. Deze kan online worden uitgevoerd via de gratis hostingprovider OnWorks voor werkstations.
Download en gebruik online gratis deze app genaamd SVoice (Speech Voice Separation) met OnWorks.
Volg deze instructies om deze app uit te voeren:
- 1. Download deze applicatie op uw pc.
- 2. Voer in onze bestandsbeheerder https://www.onworks.net/myfiles.php?username=XXXXX in met de gebruikersnaam die u wilt.
- 3. Upload deze applicatie in zo'n bestandsbeheerder.
- 4. Start een OS OnWorks online emulator vanaf deze website, maar een betere Windows online emulator.
- 5. Ga vanuit het OnWorks Windows-besturingssysteem dat u zojuist hebt gestart naar onze bestandsbeheerder https://www.onworks.net/myfiles.php?username=XXXXX met de gewenste gebruikersnaam.
- 6. Download de applicatie en installeer deze.
- 7. Download Wine van de softwarebronnen voor Linux-distributies. Eenmaal geïnstalleerd, kunt u vervolgens dubbelklikken op de app om ze met Wine uit te voeren. Je kunt ook PlayOnLinux proberen, een mooie interface via Wine waarmee je populaire Windows-programma's en -games kunt installeren.
Wine is een manier om Windows-software op Linux uit te voeren, maar zonder dat Windows vereist is. Wine is een open-source Windows-compatibiliteitslaag die Windows-programma's rechtstreeks op elke Linux-desktop kan uitvoeren. In wezen probeert Wine genoeg van Windows opnieuw te implementeren, zodat het al die Windows-applicaties kan draaien zonder Windows echt nodig te hebben.
SCREENSHOTS
Ad
SVoice (spraak-stemscheiding)
PRODUCTBESCHRIJVING
SVoice is een PyTorch-gebaseerde implementatie van Facebook Research's onderzoek naar het scheiden van stemmen van sprekers, zoals beschreven in het artikel "Voice Separation with an Unknown Number of Multiple Speakers". Dit project presenteert een deep learning-framework dat gemengde audiosequenties kan scheiden waarin meerdere mensen tegelijkertijd spreken, zonder voorafgaande kennis van het aantal sprekers. Het model maakt gebruik van gated neural networks met recurrent processing blocks die stemmen ontwarren via meerdere rekenstappen, terwijl de consistentie van de sprekers over de verschillende uitvoerkanalen behouden blijft. Afzonderlijke modellen worden getraind voor verschillende aantallen sprekers, en het model met de grootste capaciteit bepaalt dynamisch het werkelijke aantal sprekers in een mix. De repository bevat alle benodigde scripts voor training, datasetvoorbereiding, gedistribueerde training, evaluatie en audioscheiding.
Kenmerken
- End-to-end PyTorch-implementatie voor spraakscheiding met onbekende sprekersaantallen
- Gebruikt gated RNN-blokken en convolutionele encoders voor robuuste multi-speaker modellering
- Configureerbaar via Hydra met automatische controlepunten en experimentbeheer
- Ondersteunt gedistribueerde multi-GPU-training en eenvoudige configuratie van datasets
- Bevat tools voor het genereren van datasets voor ruisende en galmende synthetische mengsels
- Ingebouwde evaluatie- en gevolgtrekkingshulpmiddelen voor het scheiden en scoren van spraakvoorbeelden
Programmeertaal
Python, Unix-shell
Categorieën
Deze applicatie kan ook worden gedownload van https://sourceforge.net/projects/svoice.mirror/. Deze is gehost in OnWorks, zodat deze eenvoudig online kan worden uitgevoerd via een van onze gratis besturingssystemen.
