这是名为 gpt-oss 的 Linux 应用程序,其最新版本可以下载为 gpt-oss-main.zip。它可以在免费的工作站托管服务提供商 OnWorks 上在线运行。
使用 OnWorks 免费下载并在线运行这个名为 gpt-oss 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
gpt-us
Ad
商品描述
gpt-oss 是 OpenAI 的开放权重大型语言模型系列,旨在实现强大的推理能力、代理工作流和丰富的开发者用例。该系列包含两个主要模型:gpt-oss-120b,一个拥有 117 亿个参数的模型,针对通用高推理任务进行了优化,可在单个 H100 GPU 上运行;以及 gpt-oss-20b,一个拥有 21 亿个参数的轻量级模型,非常适合在小型硬件上运行低延迟或专用应用程序。这两个模型均采用原生 MXFP4 量化技术,以实现高效的内存利用,并支持 OpenAI 的 Harmony 响应格式,从而实现透明的全思路推理和高级工具集成,例如函数调用、浏览和 Python 代码执行。该代码库提供了多种参考实现(包括 PyTorch、Triton 和 Metal),用于教育和实验用途,以及示例客户端和工具,例如终端聊天应用程序和 Responses API 服务器。
功能
- 两种模型大小:gpt-oss-120b(117B 参数)和 gpt-oss-20b(21B 参数)
- 原生 MXFP4 量化,适用于 MoE 层,实现高效推理
- 支持完整的思路推理,具有可配置的努力级别(低、中、高)
- 用于标准化、可调试模型输出的 Harmony 响应格式
- 内置代理工具功能:函数调用、网页浏览、Python 代码执行、结构化输出
- 多个推理后端:PyTorch、Triton(优化)、Metal(Apple Silicon)
- 参考工具和客户端:终端聊天应用程序、Responses API 示例服务器
- 根据 Apache 2.0 许可进行实验、定制和商业部署
程式语言
蟒蛇,C++,C
分类
此应用程序也可从 https://sourceforge.net/projects/gpt-oss/ 获取。它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最便捷的方式在线运行。