Il s'agit de l'application Windows HunyuanVideo-Foley, dont la dernière version est téléchargeable sous le nom HunyuanVideo-Foleysourcecode.tar.gz. Elle est disponible en ligne sur l'hébergeur gratuit OnWorks pour postes de travail.
Téléchargez et exécutez en ligne cette application nommée HunyuanVideo-Foley avec OnWorks gratuitement.
Suivez ces instructions pour exécuter cette application :
- 1. Téléchargé cette application sur votre PC.
- 2. Entrez dans notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous voulez.
- 3. Téléchargez cette application dans ce gestionnaire de fichiers.
- 4. Démarrez n'importe quel émulateur en ligne OS OnWorks à partir de ce site Web, mais un meilleur émulateur en ligne Windows.
- 5. Depuis le système d'exploitation OnWorks Windows que vous venez de démarrer, accédez à notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous souhaitez.
- 6. Téléchargez l'application et installez-la.
- 7. Téléchargez Wine depuis les dépôts de logiciels de vos distributions Linux. Une fois installé, vous pouvez ensuite double-cliquer sur l'application pour les exécuter avec Wine. Vous pouvez également essayer PlayOnLinux, une interface sophistiquée sur Wine qui vous aidera à installer des programmes et des jeux Windows populaires.
Wine est un moyen d'exécuter un logiciel Windows sur Linux, mais sans Windows requis. Wine est une couche de compatibilité Windows open source qui peut exécuter des programmes Windows directement sur n'importe quel bureau Linux. Essentiellement, Wine essaie de ré-implémenter suffisamment de Windows à partir de zéro pour qu'il puisse exécuter toutes ces applications Windows sans avoir réellement besoin de Windows.
CAPTURES D'ÉCRAN:
HunyuanVidéo-Foley
DESCRIPTION:
HunyuanVideo-Foley est un modèle de diffusion multimodal de Tencent Hunyuan pour la génération audio de bruitages (effets sonores) haute fidélité synchronisés avec des scènes vidéo. Il est conçu pour générer un son qui correspond à la fois au contenu visuel et aux indices sémantiques textuels, pour une utilisation dans la production vidéo, le cinéma, la publicité, les jeux, etc. L'architecture du modèle aligne les représentations audio, vidéo et textuelles pour produire des bandes sonores synchronisées réalistes. Il produit une sortie audio 48 kHz de haute qualité, adaptée à un usage professionnel. L'architecture hybride combine des blocs de transformation multimodaux et des blocs de raffinement unimodaux. Alignement temporel via des modules de synchronisation image par image (par exemple, Synchformer).
Fonctionnement
- Génère des effets sonores / Foley synchronisés avec le contenu vidéo
- Équilibre les informations visuelles et textuelles dans la génération sonore pour éviter la domination d'une seule modalité
- Produit une sortie audio 48 kHz de haute qualité adaptée à un usage professionnel
- Architecture hybride combinant des blocs transformateurs multimodaux et des blocs de raffinement unimodaux
- Alignement temporel via des modules de synchronisation au niveau de la trame (par exemple Synchformer)
- Outils, démo, scripts d'inférence et interface utilisateur optionnelle (Gradio) inclus
Langage de programmation
Python
Catégories
Cette application est également disponible sur https://sourceforge.net/projects/hunyuanvideo-foley.mirror/. Elle est hébergée sur OnWorks afin de pouvoir être exécutée en ligne plus facilement depuis l'un de nos systèmes d'exploitation gratuits.