这是名为“遵循指示并反馈”的 Linux 应用,其最新版本可下载为 following-instructions-human-feedbacksourcecode.tar.gz。它可在免费的工作站托管服务提供商 OnWorks 上在线运行。
免费下载并在线运行这款名为“使用 OnWorks 遵循指示并提供反馈”的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
SCREENSHOTS
Ad
遵循指示并给出反馈
商品描述
following-instructions-human-feedback 代码库包含 OpenAI 训练语言模型(InstructGPT 模型)工作所需的代码和补充材料,这些模型能够通过人工反馈更好地遵循用户指令。该代码库包含模型卡片、自动评估输出示例以及过程中使用的标注指南。它与“训练语言模型以通过人工反馈遵循指令”论文明确关联,并可作为 OpenAI 如何收集注释指南、运行偏好比较和评估模型行为的参考。该代码库并非整个 RLHF 流程的完整实现,而是一个支持已发表研究的档案中心,旨在确保评估和人工标注标准的透明度。它包含 automatic-eval-samples(基准测试任务中的模型输出示例)等目录,以及一个描述 InstructGPT 模型预期行为、局限性和偏差的 model-card.md 文件。
功能
- InstructGPT 实验的评估样本输出存档
- model-card.md 描述模型的使用、限制和安全注意事项
- 用于人类评估者的标签指南/注释说明
- 结构化的“automatic-eval-samples”文件夹,显示基线与微调输出
- OpenAI 如何衡量模型偏好排名和一致性的透明度
- 原始研究论文和文献的链接和参考
分类
此应用程序也可从 https://sourceforge.net/projects/following-inst-feedback.mirror/ 获取。它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最便捷的方式在线运行。
