これはSVoice(Speech Voice Separation)というWindowsアプリで、最新リリースはsvoicesourcecode.tar.gzとしてダウンロードできます。ワークステーション向けの無料ホスティングプロバイダーであるOnWorksでオンラインで実行できます。
OnWorks を使用して、SVoice (Speech Voice Separation) というアプリを無料でダウンロードしてオンラインで実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOSOnWorksオンラインエミュレーターを起動しますが、Windowsオンラインエミュレーターの方が優れています。
-5。起動したばかりのOnWorksWindows OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードしてインストールします。
-7.LinuxディストリビューションソフトウェアリポジトリからWineをダウンロードします。 インストールしたら、アプリをダブルクリックして、Wineで実行できます。 また、人気のあるWindowsプログラムやゲームのインストールに役立つWine上の豪華なインターフェイスであるPlayOnLinuxを試すこともできます。
WineはLinux上でWindowsソフトウェアを実行する方法ですが、Windowsは必要ありません。 Wineは、任意のLinuxデスクトップでWindowsプログラムを直接実行できるオープンソースのWindows互換性レイヤーです。 基本的に、Wineは、実際にWindowsを必要とせずに、これらすべてのWindowsアプリケーションを実行できるように、十分な数のWindowsを最初から再実装しようとしています。
スクリーンショットは
Ad
SVoice(音声音声分離)
DESCRIPTION
SVoiceは、Facebook Researchによる「話者数が不明な複数話者による音声分離」という論文で説明されている話者音声分離に関する研究をPyTorchベースで実装したものです。このプロジェクトは、話者数が事前に分からなくても、複数の人が同時に話す混合音声シーケンスを分離できるディープラーニングフレームワークを提示しています。このモデルは、複数の計算ステップにわたって音声を分離する再帰処理ブロックを備えたゲート付きニューラルネットワークを採用し、出力チャネル間で話者の一貫性を維持します。異なる話者数に合わせて別々のモデルをトレーニングし、最大容量のモデルが混合音声における実際の話者数を動的に決定します。リポジトリには、トレーニング、データセットの準備、分散トレーニング、評価、音声分離に必要なすべてのスクリプトが含まれています。
オプション
- 話者数が不明な場合の音声分離のためのエンドツーエンドの PyTorch 実装
- 堅牢なマルチスピーカーモデリングのためにゲート付きRNNブロックと畳み込みエンコーダを使用する
- Hydra 経由で自動チェックポイントと実験管理を設定可能
- 分散マルチGPUトレーニングと簡単なデータセット構成をサポート
- ノイズや残響のある合成混合物のためのデータセット生成ツールが含まれています
- 音声サンプルを分離してスコアリングするための評価および推論ツールが組み込まれています
プログラミング言語
Python、Unixシェル
カテゴリー
このアプリケーションは、https://sourceforge.net/projects/svoice.mirror/ からも入手できます。OnWorks でホストされているため、無料のオペレーティングシステムから最も簡単にオンラインで実行できます。
 
 














