这是名为 Arthur Bench 的 Windows 应用程序,其最新版本可以作为 0.2.3sourcecode.zip 下载。 它可以在免费的工作站托管提供商 OnWorks 中在线运行。
免费下载并使用 OnWorks 在线运行名为 Arthur Bench 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从本网站启动任何 OS OnWorks 在线模拟器,但更好的 Windows 在线模拟器。
- 5. 从您刚刚启动的 OnWorks Windows 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序并安装。
- 7. 从您的 Linux 发行版软件存储库下载 Wine。 安装后,您可以双击该应用程序以使用 Wine 运行它们。 您还可以尝试 PlayOnLinux,这是 Wine 上的一个花哨界面,可帮助您安装流行的 Windows 程序和游戏。
Wine 是一种在 Linux 上运行 Windows 软件的方法,但不需要 Windows。 Wine 是一个开源的 Windows 兼容层,可以直接在任何 Linux 桌面上运行 Windows 程序。 本质上,Wine 试图从头开始重新实现足够多的 Windows,以便它可以运行所有这些 Windows 应用程序,而实际上不需要 Windows。
SCREENSHOTS
Ad
亚瑟·本奇
商品描述
Bench 是用于评估生产用例的法学硕士的工具。 无论您是比较不同的 LLM、考虑不同的提示,还是测试生成超参数(如温度和 # 令牌),Bench 都为您的所有 LLM 性能评估提供一个接触点。
功能
- 通过跨任务和用例的通用界面标准化法学硕士评估的工作流程
- 测试开源 LLM 是否可以在您的特定数据上与顶级闭源 LLM API 提供商一样出色
- 将 LLM 排行榜和基准的排名转化为您关心的实际用例的分数
- Bench 为您所有的 LLM 绩效评估提供一个接触点
- 将 Bench 安装到您的 python 环境中,并带有可选的依赖项,以便在本地提供结果
- 或者,以最少的依赖将 Bench 安装到您的 python 环境中
程式语言
打字稿
分类
该应用程序也可以从 https://sourceforge.net/projects/arthur-bench.mirror/ 获取。 它已托管在 OnWorks 中,以便从我们的免费操作系统之一以最简单的方式在线运行。