这是名为 Arthur Bench 的 Linux 应用程序,其最新版本可以作为 0.2.3sourcecode.zip 下载。 它可以在免费的工作站托管提供商 OnWorks 中在线运行。
免费下载并使用 OnWorks 在线运行名为 Arthur Bench 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
SCREENSHOTS
Ad
亚瑟·本奇
商品描述
Bench 是用于评估生产用例的法学硕士的工具。 无论您是比较不同的 LLM、考虑不同的提示,还是测试生成超参数(如温度和 # 令牌),Bench 都为您的所有 LLM 性能评估提供一个接触点。
特性
- 通过跨任务和用例的通用界面标准化法学硕士评估的工作流程
- 测试开源 LLM 是否可以在您的特定数据上与顶级闭源 LLM API 提供商一样出色
- 将 LLM 排行榜和基准的排名转化为您关心的实际用例的分数
- Bench 为您所有的 LLM 绩效评估提供一个接触点
- 将 Bench 安装到您的 python 环境中,并带有可选的依赖项,以便在本地提供结果
- 或者,以最少的依赖将 Bench 安装到您的 python 环境中
程式语言
打字稿
分类
该应用程序也可以从 https://sourceforge.net/projects/arthur-bench.mirror/ 获取。 它已托管在 OnWorks 中,以便从我们的免费操作系统之一以最简单的方式在线运行。