This is the Linux app named Vision Transformer Pytorch whose latest release can be downloaded as 1.15.4sourcecode.zip. It can be run online in the free hosting provider OnWorks for workstations.
使用 OnWorks 免费下载并在线运行名为 Vision Transformer Pytorch 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
截图:
Vision Transformer PyTorch
描述:
本仓库提供了一个基于 PyTorch 的极简视觉 Transformer (ViT) 实现,专注于图像分类所需的核心架构组件。它将模型分解为图像块嵌入、位置编码、多头自注意力机制、前馈模块和分类头,以便您可以单独理解每个组件。代码刻意保持简洁和模块化,方便您调整超参数、深度、宽度和注意力维度。由于它与原生 PyTorch 非常接近,您可以集成自定义数据集和训练循环,而无需担心框架锁定。它被广泛用作学习视觉 Transformer 模型的参考资料,以及研究原型所需的轻量级基线。本项目鼓励进行实验——您可以更换优化器、更改数据增强方法,或将 Transformer 主干网络集成到下游任务中。
功能
- 简洁的 PyTorch 模块,用于补丁、注意力机制、MLP 模块和头部
- 可轻松配置深度、喷头、尺寸和漏水设置
- 可直接插入常用循环的简单训练和推理示例
- 便于基于自定义数据进行实验和快速原型开发
- 最小的外部依赖和惯用的 PyTorch 风格
- 可作为 ViT 架构细节的易读参考资料。
程式语言
Python
分类
您也可以从 https://sourceforge.net/projects/vision-tran-pytorch.mirror/ 获取此应用程序。它已托管在 OnWorks 上,以便通过我们的免费操作系统之一以最简单的方式在线运行。