This is the Windows app named DeepSeek-V3.2-Exp whose latest release can be downloaded as DeepSeek-V3.2-Expsourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
使用 OnWorks 免费下载并在线运行此名为 DeepSeek-V3.2-Exp 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从本网站启动任何 OS OnWorks 在线模拟器,但更好的 Windows 在线模拟器。
- 5. 从您刚刚启动的 OnWorks Windows 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序并安装。
- 7. 从您的 Linux 发行版软件存储库下载 Wine。 安装后,您可以双击该应用程序以使用 Wine 运行它们。 您还可以尝试 PlayOnLinux,这是 Wine 上的一个花哨界面,可帮助您安装流行的 Windows 程序和游戏。
Wine 是一种在 Linux 上运行 Windows 软件的方法,但不需要 Windows。 Wine 是一个开源的 Windows 兼容层,可以直接在任何 Linux 桌面上运行 Windows 程序。 本质上,Wine 试图从头开始重新实现足够多的 Windows,以便它可以运行所有这些 Windows 应用程序,而实际上不需要 Windows。
SCREENSHOTS
Ad
DeepSeek-V3.2-Exp
商品描述
DeepSeek-V3.2-Exp 是 DeepSeek 模型系列的实验版本,旨在作为迈向下一代架构的基石。此版本的关键创新在于 DeepSeek 稀疏注意力机制 (DSA),这是一种稀疏注意力机制,旨在优化长上下文环境下的训练和推理效率,且不降低输出质量。据作者介绍,他们将 V3.2-Exp 的训练设置与 V3.1-Terminus 进行了统一,以便即使内部注意力机制发生变化,基准测试结果仍然大致可比。在各种推理、代码和问答基准测试(例如 MMLU、LiveCodeBench、AIME、Codeforces 等)的公开评测中,V3.2-Exp 的性能非常接近 V3.1-Terminus,在某些情况下甚至与之相当。该代码库包含支持全新稀疏架构的工具和内核,例如,CUDA 内核、logit 索引器以及 FlashMLA 和 DeepGEMM 等开源模块都可用于提升性能。
功能
- 自适应稀疏注意力调度,根据输入序列长度动态调整稀疏模式
- 混合用例的混合密集 + 稀疏注意力回退模式
- 针对超长上下文(例如 >1M 个令牌)的内存高效检查点
- 性能分析和可视化仪表板,用于分析注意力行为
- 插件接口用于交换不同的稀疏内核后端(例如 FlashMLA、DeepGEMM)
- 支持在分散数据上对稀疏模型进行联合微调
程式语言
Python
分类
此应用程序也可从 https://sourceforge.net/projects/deepseek-v3-2-exp.mirror/ 获取。它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最便捷的方式在线运行。