Il s'agit de l'application Linux « whistle-timestamped », dont la dernière version est téléchargeable sous le nom v1.15.9sourcecode.tar.gz. Elle peut être exécutée en ligne sur l'hébergeur gratuit OnWorks pour postes de travail.
Téléchargez et exécutez en ligne cette application nommée whisper-timestamped avec OnWorks gratuitement.
Suivez ces instructions pour exécuter cette application :
- 1. Téléchargé cette application sur votre PC.
- 2. Entrez dans notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous voulez.
- 3. Téléchargez cette application dans ce gestionnaire de fichiers.
- 4. Démarrez l'émulateur en ligne OnWorks Linux ou Windows en ligne ou l'émulateur en ligne MACOS à partir de ce site Web.
- 5. Depuis le système d'exploitation OnWorks Linux que vous venez de démarrer, accédez à notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous souhaitez.
- 6. Téléchargez l'application, installez-la et exécutez-la.
CAPTURES D'ÉCRAN
Ad
horodaté par murmure
DESCRIPTION
Reconnaissance vocale automatique multilingue avec horodatage et fiabilité au niveau des mots. Whisper est un ensemble de modèles de reconnaissance vocale multilingues robustes, entraînés par OpenAI, qui offrent des résultats de pointe dans de nombreuses langues. Les modèles Whisper ont été entraînés pour prédire l'horodatage approximatif des segments de parole (la plupart du temps avec une précision d'une seconde), mais ils ne peuvent pas prédire l'horodatage des mots. Ce référentiel propose une implémentation permettant de prédire l'horodatage des mots et d'obtenir une estimation plus précise des segments de parole lors de la transcription avec les modèles Whisper. De plus, un score de confiance est attribué à chaque mot et à chaque segment.
Fonctionnement
- L'estimation du début/de la fin est plus précise
- Documents disponibles
- Des scores de confiance sont attribués à chaque mot
- Si possible (sans recherche de faisceau...), aucune étape d'inférence supplémentaire n'est requise pour prédire les horodatages des mots (l'alignement des mots est effectué à la volée après le décodage de chaque segment de parole)
- Une attention particulière a été portée à l'utilisation de la mémoire
- Installation légère pour CPU
- Graphique de l'alignement des mots
Langage de programmation
Python
Catégories
Cette application peut également être téléchargée depuis https://sourceforge.net/projects/whisper-timestamped.mirror/. Elle est hébergée sur OnWorks afin de pouvoir être exécutée en ligne plus facilement depuis l'un de nos systèmes d'exploitation gratuits.
