Dies ist die Linux-App namens Denoiser, deren neueste Version als denoiserv0.1.4sourcecode.tar.gz heruntergeladen werden kann. Sie kann online beim kostenlosen Hosting-Anbieter OnWorks für Workstations ausgeführt werden.
Laden Sie diese App namens Denoiser mit OnWorks kostenlos herunter und führen Sie sie online aus.
Befolgen Sie diese Anweisungen, um diese App auszuführen:
- 1. Diese Anwendung auf Ihren PC heruntergeladen.
- 2. Geben Sie in unserem Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX den gewünschten Benutzernamen ein.
- 3. Laden Sie diese Anwendung in einem solchen Dateimanager hoch.
- 4. Starten Sie den OnWorks Linux-Online- oder Windows-Online-Emulator oder den MACOS-Online-Emulator von dieser Website.
- 5. Rufen Sie vom gerade gestarteten OnWorks Linux-Betriebssystem aus unseren Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX mit dem gewünschten Benutzernamen auf.
- 6. Laden Sie die Anwendung herunter, installieren Sie sie und führen Sie sie aus.
SCREENSHOTS
Ad
Denoiser
BESCHREIBUNG
Denoiser ist ein Echtzeit-Modell zur Sprachverbesserung, das direkt mit Rohwellenformen arbeitet und darauf ausgelegt ist, verrauschtes Audio zu bereinigen und gleichzeitig CPU-effizient zu laufen. Es verwendet eine kausale Encoder-Decoder-Architektur mit Skip-Verbindungen, die mit sowohl im Zeit- als auch im Frequenzbereich definierten Verlusten optimiert ist, um Rauschen besser zu unterdrücken und gleichzeitig die Sprache zu erhalten. Im Gegensatz zu Modellen, die nur mit Spektrogrammen arbeiten, ermöglicht dieses Design geringere Latenz und eine kohärente Wellenformausgabe. Die Implementierung umfasst Datenerweiterungstechniken, die auf die Rohwellenformen angewendet werden (z. B. Rauschmischung, Nachhall), um die Robustheit des Modells und die Generalisierung auf verschiedene Rauscharten zu verbessern. Das Projekt unterstützt sowohl Offline-Rauschunterdrückung (Batch-Inferenz) als auch Live-Audioverarbeitung (z. B. über Loopback-Audioschnittstellen) und ist daher für den Echtzeiteinsatz in Anrufen oder Aufzeichnungen geeignet. Der Code umfasst Trainings- und Evaluierungsskripte, Konfigurationsmanagement über Hydra und vortrainierte Modelle auf Standard-Rauschdatensätzen.
Eigenschaften
- Kausale Wellenform-Domänen-Sprachverbesserung (keine spektrale Inversion)
- Encoder-Decoder-Architektur mit Skip-Verbindungen für hohe Wiedergabetreue
- Kombinierte Verlustoptimierung im Zeit- und Frequenzbereich
- Erweiterung der Rohwellendaten zur Erhöhung der Robustheit gegenüber Rauschen/Hall
- Unterstützung für Live-Audioverarbeitung mit geringer Latenz
- Trainings-/Evaluierungsskripte mit vortrainierten Modellen und Konfigurationspipeline
Programmiersprache
Python
Kategorien
Diese Anwendung ist auch unter https://sourceforge.net/projects/denoiser.mirror/ verfügbar. Sie wurde in OnWorks gehostet, um sie auf einfachste Weise online von einem unserer kostenlosen Betriebssysteme aus ausführen zu können.