这是名为 Qwen2-Audio 的 Windows 应用程序,其最新版本可以下载为 Qwen2-Audiosourcecode.tar.gz。它可以在免费的工作站托管服务提供商 OnWorks 上在线运行。
免费下载并使用 OnWorks 在线运行此名为 Qwen2-Audio 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从本网站启动任何 OS OnWorks 在线模拟器,但更好的 Windows 在线模拟器。
- 5. 从您刚刚启动的 OnWorks Windows 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序并安装。
- 7. 从您的 Linux 发行版软件存储库下载 Wine。 安装后,您可以双击该应用程序以使用 Wine 运行它们。 您还可以尝试 PlayOnLinux,这是 Wine 上的一个花哨界面,可帮助您安装流行的 Windows 程序和游戏。
Wine 是一种在 Linux 上运行 Windows 软件的方法,但不需要 Windows。 Wine 是一个开源的 Windows 兼容层,可以直接在任何 Linux 桌面上运行 Windows 程序。 本质上,Wine 试图从头开始重新实现足够多的 Windows,以便它可以运行所有这些 Windows 应用程序,而实际上不需要 Windows。
SCREENSHOTS
Ad
Qwen2-音频
商品描述
Qwen2-Audio 是阿里云开发的大型音频语言模型,隶属于 Qwen 系列。该模型经过训练,可以接受各种音频信号输入(包括语音、声音等),并进行语音聊天和音频分析,最终生成文本响应。它支持两种主要模式:语音聊天(纯语音交互)和音频分析(音频+文本指令),并包含基础模型和指令调整模型。该模型已在多个基准测试(语音识别、翻译、声音分类、情感等)上进行评估,并提供通过 ModelScope 和 Hugging Face 发布的预训练模型(例如 7B)。代码和示例提供了 Hugging Face Transformer,以及通过 AutoProcessor、模型类等方式使用。它在许多标准基准测试中均表现出色,包括自动语音识别、语音情感识别、人声分类、语音翻译等。
功能
- 双重交互模式:语音聊天(仅音频)和音频分析(音频+文本指令)
- 包括基础模型和指令调整模型(7B 尺寸)
- 在许多标准基准上表现出色:ASR、语音情感识别、声音分类、语音翻译等。
- Hugging Face 转换器提供的代码和示例,以及通过 AutoProcessor、模型类等的使用。
- 支持特定时长的音频输入(30 秒以下的音频片段效果最佳)
- 提供 Web UI 演示、评估脚本,并以开放权重发布以供研究/使用
程式语言
Python
分类
此应用程序也可从 https://sourceforge.net/projects/qwen2-audio.mirror/ 获取。它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最便捷的方式在线运行。
