这是名为“从反馈中总结”的 Linux 应用,其最新版本可以下载为“summarize-from-feedbacksourcecode.tar.gz”。它可以在免费的工作站托管服务提供商 OnWorks 上在线运行。
免费在线下载并运行这个名为“使用 OnWorks 从反馈中总结”的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
SCREENSHOTS
Ad
总结反馈
商品描述
反馈总结 (summarize-from-feedback) 代码库实现了论文《学习从人类反馈中总结》(Learning to Summarize from Human Feedback) 中的方法。其目的是训练一个更符合人类偏好的总结模型,首先收集人类反馈(摘要之间的比较)来训练奖励模型,然后微调策略(总结器)以最大化学到的奖励。代码包含不同的阶段:监督基线(即标准总结训练)、奖励建模组件和强化学习(或基于偏好的微调)阶段。该代码库还包含用于数据集处理、建模架构、推理和评估的实用程序。由于代码库处于实验阶段,部分代码可能无法开箱即用,具体取决于依赖项或环境,但它仍然是如何通过人类反馈实现总结的权威参考。
功能
- 监督基线摘要模型初始化性能
- 通过人工比较摘要对来训练奖励模型
- 基于偏好的微调/RL 阶段,以优化摘要器以适应人类判断
- 数据集处理模块(加载、比较、分割)
- 用于生成和评分摘要的推理和评估脚本
- 支持模块化模型定义的架构布局文件(例如 model_layout.py)
程式语言
Python
分类
此应用程序也可从 https://sourceforge.net/projects/summarize-from-feedback.mirror/ 获取。它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最便捷的方式在线运行。