这是名为 Profile Data 的 Linux 应用程序,其最新版本可以下载为 profile-datasourcecode.tar.gz。它可以在免费的工作站托管服务提供商 OnWorks 上在线运行。
免费在线下载并运行这个名为 Profile Data with OnWorks 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
SCREENSHOTS
Ad
档案资料
商品描述
profile-data 是一个存储库,用于发布 DeepSeek 训练和推理基础设施(尤其是在 DeepSeek-V3 / R1 实验期间)的分析轨迹和指标。分析数据旨在深入了解计算-通信重叠、流水线调度(例如 DualPipe)以及 MoE/EP/并行策略在实际系统中的交互方式。该存储库包含 JSON 轨迹文件,例如 train.json、prefill.json、decode.json 和相关资源。用户可以将它们加载到 Chrome 追踪等工具中,以检查 GPU 空闲时间、重叠操作和调度对齐情况。其目的是使内部效率权衡更加透明,使研究人员能够重现、分析或改进 DeepSeek 的并行策略。README 文件解释了轨迹数据如何与前向/后向块、设置(例如 EP64、TP1、4K 序列长度)相对应,并指出为简单起见,不包括流水线通信。
功能
- 训练、预填充和推理阶段的分析轨迹 (JSON)
- 支持 Chrome 跟踪(以及类似的可视化工具)
- 实验设置文档(例如 MoE、管道形状)
- 计算通信重叠和管道气泡行为的透明度
- 从 DeepSeek 堆栈公开访问真实系统性能数据
- 支持并行策略的外部分析、验证和基准测试
分类
此应用程序也可从 https://sourceforge.net/projects/profile-data.mirror/ 获取。它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最便捷的方式在线运行。