This is the Linux app named Multimodal whose latest release can be downloaded as multimodalv2025.10.06.00sourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
免费下载并在线运行这个名为 Multimodal with OnWorks 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
SCREENSHOTS
Ad
多式联运
商品描述
该项目也称为 TorchMultimodal,是一个 PyTorch 库,用于大规模构建、训练和试验多模态、多任务模型。该库提供模块化构建块,例如编码器、融合模块、损失函数和转换,支持在统一架构中组合多种模态(视觉、文本、音频等)。它包含一系列现成的模型类,例如 ALBEF、CLIP、BLIP-2、COCA、FLAVA、MDETR 和 Omnivore,可作为参考实现,供您采用或调整。其设计强调可组合性:您可以混合搭配编码器、融合和解码器组件,而无需从单一模型开始。该存储库还包含常见多模态任务(例如检索、视觉问答、基础)的示例脚本和数据集,以便您可以端到端地测试和比较模型。安装支持 CPU 和 CUDA,并且代码库已进行版本控制、测试和维护。
功能
- 用于多模态架构的模块化编码器、融合层和损失模块
- 参考模型实现(ALBEF、CLIP、BLIP-2、FLAVA、MDETR 等)
- VQA、检索、基础和多任务学习等任务的示例流程
- 灵活的融合策略:早期、晚期、交叉注意力等。
- 用于模态预处理和对齐的转换实用程序
- 支持 CPU 和 GPU 设置,并带有版本化、测试过的代码库
程式语言
Python
分类
此应用程序也可从 https://sourceforge.net/projects/multimodal.mirror/ 获取。它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最便捷的方式在线运行。