これはHunyuanVideo-FoleyというWindowsアプリで、最新リリースはHunyuanVideo-Foleysourcecode.tar.gzとしてダウンロードできます。ワークステーション向けの無料ホスティングプロバイダーであるOnWorksでオンラインで実行できます。
OnWorks を使用して、HunyuanVideo-Foley というアプリを無料でダウンロードし、オンラインで実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOSOnWorksオンラインエミュレーターを起動しますが、Windowsオンラインエミュレーターの方が優れています。
-5。起動したばかりのOnWorksWindows OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードしてインストールします。
-7.LinuxディストリビューションソフトウェアリポジトリからWineをダウンロードします。 インストールしたら、アプリをダブルクリックして、Wineで実行できます。 また、人気のあるWindowsプログラムやゲームのインストールに役立つWine上の豪華なインターフェイスであるPlayOnLinuxを試すこともできます。
WineはLinux上でWindowsソフトウェアを実行する方法ですが、Windowsは必要ありません。 Wineは、任意のLinuxデスクトップでWindowsプログラムを直接実行できるオープンソースのWindows互換性レイヤーです。 基本的に、Wineは、実際にWindowsを必要とせずに、これらすべてのWindowsアプリケーションを実行できるように、十分な数のWindowsを最初から再実装しようとしています。
スクリーンショット:
フンユアンビデオフォーリー
説明:
HunyuanVideo-Foleyは、Tencent Hunyuanが提供するマルチモーダル拡散モデルです。動画シーンに同期した高忠実度のフォーリー(効果音)オーディオ生成を実現します。映像コンテンツとテキストの意味的手がかりの両方に一致するオーディオを生成するよう設計されており、動画制作、映画、広告、ゲームなどで活用できます。このモデルアーキテクチャは、オーディオ、動画、テキスト表現を整合させ、リアルな同期サウンドトラックを生成します。プロフェッショナルユースに適した高品質な48kHzオーディオ出力を生成します。マルチモーダル変換ブロックとユニモーダルリファインメントブロックを組み合わせたハイブリッドアーキテクチャを採用しています。フレームレベル同期モジュール(Synchformerなど)による時間的アライメントも実現しています。
オプション
- ビデオコンテンツと同期したフォーリー/効果音オーディオを生成します
- 音声生成において、視覚情報とテキスト情報のバランスをとり、単一のモダリティによる支配を回避します。
- プロフェッショナルな使用に適した高品質の48kHzオーディオ出力を生成します
- マルチモーダルトランスフォーマーブロックとユニモーダルリファインメントブロックを組み合わせたハイブリッドアーキテクチャ
- フレームレベルの同期モジュール(Synchformerなど)による時間的な調整
- ツール、デモ、推論スクリプト、オプションのフロントエンド(Gradio)が含まれています
プログラミング言語
Python
カテゴリー
このアプリケーションは、https://sourceforge.net/projects/hunyuanvideo-foley.mirror/ からも入手できます。OnWorks でホストされているため、無料のオペレーティングシステムから最も簡単にオンラインで実行できます。