这是名为 DOLMA 的 Linux 应用程序,其最新版本可以下载为 v1.2.0sourcecode.tar.gz。它可以在免费的工作站托管服务提供商 OnWorks 上在线运行。
使用 OnWorks 免费下载并在线运行此名为 DOLMA 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
截图:
卓玛
描述:
DOLMA(模型对齐的数据优化和学习)是一个旨在管理大规模数据集以有效地训练和微调语言模型的框架。
特性
- 支持数据集清理和过滤,以便更好地进行模型训练
- 实施重复数据删除和压缩技术
- 针对大规模 NLP 数据集处理进行了优化
- 提供符合道德和负责任的数据集管理工具
- 与流行的基于转换器的 LLM 架构兼容
- 开源且可适应不同的人工智能研究需求
程式语言
Python
分类
自然语言处理(NLP)
此应用程序也可从 https://sourceforge.net/projects/dolma.mirror/ 获取。它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最便捷的方式在线运行。