这是名为 Live Transcribe Speech Engine 的 Linux 应用程序,其最新版本可以下载为 live-transcribe-speech-enginesourcecode.tar.gz。它可以在免费的工作站托管服务提供商 OnWorks 上在线运行。
免费在线下载并运行此名为 Live Transcribe Speech Engine with OnWorks 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
截图:
实时转录语音引擎
描述:
实时转录语音引擎 (Live Transcribe Speech Engine) 提供设备端语音识别组件,支持实时转录,从而实现无障碍访问和日常语音优先体验。其设计优先考虑嘈杂远场环境中的延迟和稳健性,从而能够在移动硬件上实现低延迟的连续转录。该引擎管理音频前端处理(例如噪声抑制和语音活动检测),然后将音频输入到紧凑、精确的声学和语言模型中。部分假设在单词识别过程中流动,然后随着置信度的增加而稳定下来,抖动最小化,这对于可用性至关重要。该代码强调高效利用 CPU 和神经加速器,以平衡电池续航时间和响应速度。它部署在无障碍环境中,旨在实现跨口音、环境和间歇性连接下的可靠行为,并在资源受限时优雅地降级。
功能
- 实时、低延迟的设备转录
- 具有噪声抑制和 VAD 功能的强大音频前端
- 流式传输部分结果,快速收敛到最终文本
- 在不同口音和嘈杂环境中表现出色
- 针对移动 CPU/NPU 和电池寿命进行调整的高效模型
- 适用于辅助功能应用程序和实时字幕工作流程的 API
程式语言
爪哇岛
分类
此应用程序也可从 https://sourceforge.net/projects/live-transcribe-speech.mirror/ 获取。它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最便捷的方式在线运行。