This is the Linux app named Automated Interpretability whose latest release can be downloaded as automated-interpretabilitysourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
免费下载并在线运行这个名为“使用 OnWorks 的自动解释性”的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
SCREENSHOTS
Ad
自动可解释性
商品描述
自动解释性代码库实现了用于自动生成、模拟和评分神经网络中神经元(或潜在特征)行为解释的工具和流程。此代码库并非单纯依赖于手动、临时的可解释性探索,而是旨在通过使用生成候选解释并评估其质量的算法方法来扩展可解释性。它包含一个“神经元解释器”组件,该组件根据目标神经元或潜在特征,提出自然语言解释或启发式方法(例如,“当输入具有属性 X 时,该神经元被激活”),然后模拟样本输入的激活行为,以测试该解释是否成立。该项目还包含一个“神经元查看器”Web 组件,用于浏览神经元、解释和激活模式,使其更具交互性和探索性。
功能
- 神经元解释器模块,为神经元/潜在特征行为提供自然语言或基于规则的解释
- 通过比较输入中的预测激活与真实激活来模拟/评分解释
- 神经元查看器 UI,用于浏览神经元、查看激活并检查解释
- 演示笔记本,说明如何生成和评估解释(例如 explain_puzzles.ipynb)
- 激活捕获和分析的基础设施(例如activations.py等模块)
- 排名/评分启发式方法,以决定哪些解释更可靠或更有用
程式语言
Python
分类
此应用程序也可从 https://sourceforge.net/projects/automated-interpretab.mirror/ 获取。它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最便捷的方式在线运行。