Это приложение для Linux под названием SVoice (Speech Voice Separation), последнюю версию которого можно скачать в формате svoicesourcecode.tar.gz. Его можно запустить онлайн на бесплатном хостинг-провайдере OnWorks для рабочих станций.
Бесплатно скачайте и запустите онлайн это приложение под названием SVoice (Speech Voice Separation) с помощью OnWorks.
Следуйте этим инструкциям, чтобы запустить это приложение:
- 1. Загрузил это приложение на свой компьютер.
- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 3. Загрузите это приложение в такой файловый менеджер.
- 4. Запустите онлайн-эмулятор OnWorks Linux или Windows или онлайн-эмулятор MACOS с этого веб-сайта.
- 5. В только что запущенной ОС OnWorks Linux перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 6. Скачайте приложение, установите его и запустите.
СКРИНШОТЫ
Ad
SVoice (разделение речи и голоса)
ОПИСАНИЕ
SVoice — это реализация исследования Facebook Research по разделению голосов говорящих на основе PyTorch, описанного в статье «Разделение голосов с неизвестным количеством говорящих». Этот проект представляет собой фреймворк глубокого обучения, способный разделять смешанные аудиопоследовательности, в которых несколько человек говорят одновременно, без предварительного знания количества говорящих. Модель использует управляемые нейронные сети с рекуррентными блоками обработки, которые разделяют голоса на нескольких вычислительных этапах, сохраняя при этом единообразие говорящих во всех выходных каналах. Отдельные модели обучаются для разного количества говорящих, и модель с наибольшей емкостью динамически определяет фактическое количество говорящих в смеси. Репозиторий содержит все необходимые скрипты для обучения, подготовки набора данных, распределенного обучения, оценки и разделения звука.
Особенности
- Реализация сквозного PyTorch для разделения речи с неизвестным количеством говорящих
- Использует управляемые блоки RNN и сверточные кодеры для надежного моделирования многоаудитории
- Настраивается через Hydra с автоматическим созданием контрольных точек и управлением экспериментами
- Поддерживает распределенное обучение на нескольких GPU и простую настройку наборов данных
- Включает инструменты генерации наборов данных для шумных и реверберирующих синтетических смесей
- Встроенные инструменты оценки и вывода для разделения и оценки образцов речи
Язык программирования
Python, оболочка Unix
Категории
Это приложение также можно скачать по адресу https://sourceforge.net/projects/svoice.mirror/. Оно размещено на платформе OnWorks для максимально удобного запуска онлайн через одну из наших бесплатных операционных систем.
