这是名为 whisper-timestamped 的 Linux 应用,其最新版本可下载为 v1.15.9sourcecode.tar.gz。它可在免费的工作站托管服务提供商 OnWorks 上在线运行。
使用 OnWorks 免费下载并在线运行这个名为 whisper-timestamped 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
截图:
私语时间戳
描述:
具有词级时间戳和置信度的多语言自动语音识别。Whisper 是一套由 OpenAI 训练的多语言、强大的语音识别模型,在多种语言中取得了最佳效果。Whisper 模型被训练用于预测语音片段的近似时间戳(大多数情况下精度达到 1 秒),但它们最初无法预测单词时间戳。本代码库提出了一种实现方案,用于预测单词时间戳,并在使用 Whisper 模型进行转录时提供更准确的语音片段估计。此外,每个单词和每个片段都分配了一个置信度分数。
功能
- 开始/结束估计更准确
- 可用文档
- 每个单词都分配有置信度分数
- 如果可能的话(没有波束搜索......),不需要额外的推理步骤来预测单词时间戳(在解码每个语音段后动态完成单词对齐)
- 对于内存使用情况进行了特别的关注
- CPU 的轻型安装
- 词对齐图
程式语言
Python
分类
此应用程序也可从 https://sourceforge.net/projects/whisper-timestamped.mirror/ 获取。它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最便捷的方式在线运行。