英语法语西班牙语

Ad


OnWorks 网站图标

alt-nvidia-304-updates-smi - 云端在线

在 OnWorks 免费托管服务提供商中通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器运行 alt-nvidia-304-updates-smi

这是命令 alt-nvidia-304-updates-smi 可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


nvidia-smi - NVIDIA 系统管理接口程序

概要


nvidia-smi [选项1 [ARG1]] [选项2 [ARG2]] ...

商品描述


NVSMI 为每个 NVIDIA Tesla 设备及其每个设备提供监控信息。
基于费米和开普勒的高端 Quadro 设备。 它提供的非常有限
其他类型 NVIDIA 设备的信息。 请参阅 NVML 文档,网址为
http://developer.nvidia.com/nvidia-management-library-nvml 支持哪些功能
在特定设备上。 数据以纯文本或 XML 格式显示,通过
标准输出或文件。 NVSMI 还提供了多种用于更改设备的管理操作
州。

请注意,NVSMI 的功能是通过基于 NVML C 的库公开的。 见
有关 NVML 的更多信息,请访问 NVIDIA 开发者网站。 Python 和 Perl 包装器
NVML 也可用。 不保证 NVSMI 的输出是向后的
兼容的; NVML 和绑定是向后兼容的。

http://developer.nvidia.com/nvidia-management-library-nvml/

http://pypi.python.org/pypi/nvidia-ml-py/

http://search.cpan.org/search?查询=nvidia%3A%3Aml

配置


一般 配置
-H, - 帮帮我
打印使用信息并退出。

概要 配置
-L, --列出 GPU
列出系统中的每个 NVIDIA GPU,以及它们的序列号或 UUID。
Fermi 和 Kepler 系列的 Tesla 和 Quadro GPU 报告的序列号匹配
物理上印在每个板上的 id。 GT200 Tesla 产品仅支持 UUID,
也是唯一的,但不对应于板上的任何标识符。 所有其他产品
报告 不适用。

QUERY 配置
-q, - 询问
显示 GPU 或单位信息。 显示的信息包括 (GPU ATTRIBUTES)
要么 (单元 ATTRIBUTES) 部分。 某些设备和/或环境没有
支持所有可能的信息。 任何不受支持的数据在
输出。 默认情况下,显示所有可用 GPU 或单元的信息。 使用 -i
将输出限制为单个 GPU 或单元的选项。

[加 可选的]
-你, - 单元
显示单元数据而不是 GPU 数据。 单位数据仅适用于 NVIDIA S-class
特斯拉外壳。

-一世, --id=ID
显示单个指定 GPU 或单元的数据。 指定的 id 可能是 GPU/Unit 的
驱动程序返回的自然枚举中的基于 0 的索引,GPU 的板序列
数字、GPU 的 UUID 或 GPU 的 PCI 总线 ID(如域:总线:设备.函数,十六进制)。
建议需要一致性的用户使用 UUID 或 PCI 总线 ID,因为
设备枚举顺序不能保证在重新启动和板之间保持一致
序列号可能在同一块板上的多个 GPU 之间共享。

-f 文件, --文件名=文件
将查询输出重定向到指定的文件来代替默认的标准输出。 指定的
文件将被覆盖。

-X, --xml格式
生成 XML 输出以代替默认的人类可读格式。 GPU 和 Unit 查询
输出符合相应的 DTD。 这些可通过 --dtd 旗。

--dtd
与...配合使用 -x. 在 XML 输出中嵌入 DTD。

-d, - 展示
仅显示选定信息:MEMORY、UTILIZATION、ECC、TEMPERATURE、POWER、CLOCK、
计算、PIDS、性能。 标志可以与逗号组合,例如“MEMORY,ECC”。 没有
使用 -u/--unit 或 -x/--xml-format 标志。

-l 证监会, --循环=SEC
以指定的时间间隔连续上报查询数据,而不是默认的只是
一次。 应用程序将在查询之间休眠。 请注意,在 Linux ECC 错误或 XID 上
错误事件将在睡眠期间打印出来,如果 -x 未指定标志。
随时按 Ctrl+C 将中止循环,否则循环将无限期运行。
如果没有为 -l 使用 5 秒的默认间隔。

支持装置 改性 配置
[任何 一种 的]
-下午, --持久模式=模式
为目标 GPU 设置持久化模式。 见 (GPU ATTRIBUTES) 部分
持久化模式的描述。 需要root。 除非单个 GPU,否则将影响所有 GPU
指定使用 -i 争论。 此操作的效果是立竿见影的。 然而,
它不会在重新启动后持续存在。 每次重启后持久化模式将默认为
“残疾”。 仅在 Linux 上可用。

-e, --ecc-config=配置
为目标 GPU 设置 ECC 模式。 见 (GPU ATTRIBUTES) 部分的说明
ECC 模式。 需要root。 除非使用指定单个 GPU,否则将影响所有 GPU
-i 争论。 此设置在下次重新启动后生效,并且是持久的。

-p, --reset-ecc-errors=类型
重置目标 GPU 的 ECC 错误计数器。 见 (GPU ATTRIBUTES) 部分
ECC 错误计数器类型的描述。 可用参数是 0|VOLATILE 或
1|聚合。 需要root。 除非使用指定单个 GPU,否则将影响所有 GPU
-i 争论。 此操作的效果是立竿见影的。

-C, --计算模式=模式
设置目标 GPU 的计算模式。 见 (GPU ATTRIBUTES) 部分
计算模式的描述。 需要root。 将影响所有 GPU,除非单个 GPU
指定使用 -i 争论。 此操作的效果是立竿见影的。 然而,它
在重新启动后不会持续存在。 每次重新启动后,计算模式将重置为“默认”。

-DM, --驱动程序模型
-fdm, --force-驱动程序模型
启用或禁用 TCC 驱动程序模型。 仅适用于 Windows。 需要管理员权限。
-dm 如果连接了显示器,将会失败,但是 -fdm 将强制更改驱动程序模型。
将影响所有 GPU,除非使用 -i 争论。 重启是
发生变化所必需的。 看 驱动器 型号 有关 Windows 的更多信息
驱动程序模型。

——戈姆
设置 GPU 操作模式:0/ALL_ON、1/COMPUTE、2/LOW_DP GK110 M-class 和 X- 支持
类特斯拉&tm; 开普勒家族的产品。 Quadro ® 和 Tesla 不支持
&Tm值; C级产品。 需要管理员权限。 看 GPU 操作 时尚
有关 GOM 的更多信息。 GOM 更改在重新启动后生效。 重启要求
将来可能会被删除。 仅计算 GOM 不支持 WDDM(Windows 显示
驱动模型)

-r, --gpu-重置
触发 GPU 的辅助总线重置。 可用于在某些情况下重置 GPU 硬件状态
否则将需要重新启动机器。 如果双位 ECC 错误,通常很有用
已经发生了。 需要 -i 切换到目标特定设备。 需要root。 不能有
是使用此特定设备的任何应用程序(例如 CUDA 应用程序、图形
应用程序如 X 服务器,监控应用程序如 nvidia-smi 的其他实例)。
也不能在系统中的任何其他 GPU 上运行任何计算应用程序。 仅有的
在 Linux 上运行的 Fermi 和 Kepler 系列的受支持设备上。

不能保证 GPU 重置在所有情况下都有效。 在某些情况下可能有硬件
复位后无法恢复到初始状态的电路板上的组件
要求。 这更有可能在费米代产品与开普勒产品上看到,等等
如果在挂起的 GPU 上执行重置,则可能会看到。

重置后,建议先验证 GPU 的健康状况,然后再进一步
用。 nvidia-healthmon 工具是本次测试的不错选择。 如果 GPU 不健康
应通过对节点进行电源循环来启动完全重置。 nvidia-healthmon 是
作为 TDK 的一部分分发 http://developer.nvidia.com/tesla-deployment-kit

-交流, --applications-clocks=MEM_CLOCK,GRAPHICS_CLOCK
指定最大值时钟作为定义 GPU 的一对(例如 2000,800)
在 GPU 上运行应用程序时的速度。 仅在 Kepler 系列支持的设备上。
需要root。

-rac, --重置应用程序时钟
将应用程序时钟重置为默认值。 仅在 Kepler 支持的设备上
家庭。 需要root。

-pl, --功率限制=POWER_LIMIT
以瓦特为单位指定最大功率限制。 接受整数和浮点数。 仅有的
在 Kepler 系列支持的设备上。 需要管理员权限。 价值需求
介于 nvidia-smi 报告的 Min 和 Max Power Limit 之间。

[加 可选的]
-一世, --id=ID
修改单个指定的 GPU。 指定的 id 可能是 GPU/Unit 中的基于 0 的索引
驱动返回的自然枚举,GPU的板卡序列号,GPU的
UUID,或 GPU 的 PCI 总线 ID(如域:总线:设备。十六进制)。 推荐
要求一致性的用户使用 UUID 或 PCI 总线 ID,因为设备枚举
不能保证重新启动和板序列号之间的顺序一致
在同一块板上的多个 GPU 之间共享。

单元 改性 配置
-t, --toggle-led=状态
将本机正面和背面的 LED 指示灯状态设置为指定颜色。 看
这 (单元 ATTRIBUTES) 部分,了解 LED 状态的描述。 允许的颜色是
0|绿色和 1|琥珀色。 需要root。

[加 可选的]
-一世, --id=ID
修改单个指定单元。 指定的 id 是 Unit 中从 0 开始的索引
驱动程序返回的自然枚举。

SHOW DTD 配置
--dtd
显示设备或单元 DTD。

[加 可选的]
-f 文件, --文件名=文件
将查询输出重定向到指定的文件来代替默认的标准输出。 指定的
文件将被覆盖。

-你, - 单元
显示单元 DTD 而不是设备 DTD。

GPU ATTRIBUTES


下面的列表描述了所有可能的数据返回 -q 设备查询选项。
除非另有说明,所有数值结果均以 10 为底且无单位。

时间戳
调用 nvidia-smi 时的当前系统时间戳。 格式为“星期几
月日 HH:MM:SS 年”。

驱动器 版本
已安装的 NVIDIA 显示驱动程序的版本。 这是一个字母数字字符串。

图形处理器
可访问的 NVIDIA GPU 的数量。 在 Linux 下,所有 NVIDIA GPU 都应该是
可访问的。

产品 名字
GPU 的官方产品名称。 这是一个字母数字字符串。 适用于所有产品。

屏 显: 时尚
指示显示器是否连接到 GPU 的标志。 “启用”表示
附显示器。 “禁用”表示其他情况。

坚持 时尚
指示是否为 GPU 启用持久性模式的标志。 价值是
“启用”或“禁用”。 启用持久性模式后,NVIDIA 驱动程序仍然存在
即使不存在活动客户端(例如 X11 或 nvidia-smi),也会加载。 这最大限度地减少了
与运行相关应用程序(例如 CUDA 程序)相关的驱动程序加载延迟。 为了
所有支持 CUDA 的产品。 仅限 Linux。

驱动器 型号
在 Windows 上,支持 TCC 和 WDDM 驱动程序模型。 可以更改驱动程序模型
与 (-dm)或(-fdm) 标志。 TCC 驱动程序模型针对计算进行了优化
应用程序。 使用 TCC,IE 内核启动时间会更快。 WDDM 驱动程序模型
专为图形应用程序设计,不推荐用于计算应用程序。
Linux 不支持多个驱动程序模型,并且始终具有“N/A”值。

电流 当前使用的驱动程序模型。 在 Linux 上总是“不适用”。

待审批 下次重新启动时将使用的驱动程序模型。 总是“不适用”
Linux操作系统。

串行 联系电话
该编号与实际印刷在每块板上的序列号相匹配。 它是一个全球
唯一不可变的字母数字值。

GPU UUID
该值是 GPU 的全局唯一不可变字母数字标识符。 它确实
不对应板上的任何物理标签。

BIOS 版本
GPU 板的 BIOS。

信息 版本
GPU 板信息存储中每个对象的版本号。 该信息是一个
GPU 的配置和状态数据的小型持久存储。 所有信息版本
字段是数字。 知道这些版本号会很有用,因为某些 GPU
功能仅适用于特定版本或更高版本的信息。

如果以下任何字段返回未知错误,则额外的 Inform 验证检查是
执行并显示相应的警告消息。

图片 版本 OEM 配置数据的版本。 infoROM的全球版本
图片。 映像版本就像 VBIOS 版本一样,唯一地描述了确切的
与 infoROM 对象相比,板上闪烁的 infoROM 版本
版本,这只是支持功能的一个指标。

OEM 摆件 OEM 配置数据的版本。

ECC 摆件 ECC 记录数据的版本。

功率 摆件 电源管理数据的版本。

GPU 操作 时尚
GOM 允许通过禁用 GPU 功能来降低功耗并优化 GPU 吞吐量。

每个 GOM 旨在满足特定的用户需求。

在 ALL_ON 模式下,一切都启用并全速运行。

COMPUTE 模式专为仅运行计算任务而设计。 图形操作不是
不允许的。

LOW_DP 模式设计用于运行不需要高
带宽双精度。

GOM 可以用 (——戈姆) 旗帜。

支持 GK110 M 级和 X 级 Tesla &tm; 开普勒家族的产品。 不是
支持 Quadro® 和 Tesla &tm; C级产品。

电流 当前使用的 GOM。

待审批 下次重新启动时将使用的 GOM。

PCI
设备的基本 PCI 信息。 每当卡片出现时,其中一些信息可能会发生变化
在系统中添加/删除/移动。 适用于所有产品。

公共汽车 PCI 总线编号,以十六进制表示

设备 PCI 设备编号,以十六进制表示

域名 PCI 域号,以十六进制表示

设备 Id PCI 供应商设备 ID,以十六进制表示

小组 系统 Id PCI 子系统 ID,十六进制

公共汽车 Id PCI 总线 ID 为“域:总线:设备.功能”,十六进制

GPU 链接 信息
PCIe 链路生成和总线宽度

电流 当前链接生成和宽度。 当 GPU
未使用。

最大 此 GPU 和系统可实现的最大链接生成和宽度
配置。 例如,如果 GPU 支持更高的 PCIe 代
比系统支持然后这报告系统 PCIe 代。

风扇 迅速的
风扇速度值是设备风扇当前最大速度的百分比
打算运行。 它的范围从 0 到 100%。 注意:报告的速度是预期的
风扇转速。 如果风扇被物理阻塞且无法旋转,则此输出将不会
与实际风扇速度相匹配。 许多部件不报告风扇速度,因为它们依赖于
通过周围机柜中的风扇冷却。 对于所有具有专用的分立产品
球迷。

性能 州/领地
GPU 的当前性能状态。 状态范围从 P0(最大性能)到
P12(最低性能)。

风门 原因
检索有关降低时钟频率的因素的信息。 仅在
支持来自 Kepler 系列的 Tesla 设备。

如果所有节流原因都返回为“Not Active”,则意味着时钟正在运行
尽可能高。

空闲 GPU 上什么都没有运行,时钟下降到空闲状态。
此限制器可能会在以后的版本中删除。

用户 已定义
GPU 时钟受用户指定的限制。 例如由 nvidia-smi 设置
--应用程序时钟=

SW 功率 SW Power Scaling 算法将时钟减少到低于请求的时钟
因为 GPU 消耗太多电量。 例如,软件功率上限限制可以
使用 nvidia-smi --power-limit= 更改

HW 慢一点 已启用 HW 减速(将核心时钟减少 2 倍或更多)。

这是一个指标:
* 温度过高
* 外部电源制动断言被触发(例如由系统电源
供应)
* 功耗太高,快速触发保护正在减少时钟
* 也可能在 PState 或时钟更改期间报告
** 此行为可能会在以后的版本中删除

不明 其他一些未指定的因素是减少时钟。

内存 用法
板载内存信息。 报告的总内存受 ECC 状态的影响。 如果 ECC 是
启用总可用内存减少几个百分点,由于必要
奇偶校验位。 驱动程序也可能保留少量内存供内部使用,即使
无需在 GPU 上积极工作。 适用于所有产品。

合计 已安装的 GPU 总内存。

活动上下文分配的总内存。

Free 总可用内存。

计算 时尚
计算模式标志指示单个或多个计算应用程序是否可以
在 GPU 上运行。

“默认”表示每个设备允许多个上下文。

“EXCLUSIVE_THREAD”意味着每个设备只允许一个上下文,可从一个线程在
一个时间。

“EXCLUSIVE_PROCESS”意味着每个设备只允许一个上下文,可从多个
一次线程。

“禁止”意味着每个设备都不允许使用上下文(没有计算应用程序)。

在 CUDA 4.0 中添加了“EXCLUSIVE_PROCESS”。 之前的 CUDA 版本仅支持一个
独占模式,相当于 CUDA 4.0 及更高版本中的“EXCLUSIVE_THREAD”。

适用于所有支持 CUDA 的产品。

采用
利用率报告每个 GPU 随时间推移的繁忙程度,并可用于确定
很多应用程序都在使用系统中的 GPU。

GPU 过去一秒内一个或多个内核的时间百分比
在 GPU 上执行。

内存 过去一秒内全局(设备)内存的时间百分比
正在被读取或写入。

软腐病 时尚
指示是否启用 ECC 支持的标志。 可能是“启用”或
“残疾”。 更改为 ECC 模式需要重新启动。 需要Inforom ECC 对象版本
1.0或更高。

电流 GPU 当前运行的 ECC 模式。

待审批 下次重启后 GPU 将运行的 ECC 模式。

ECC 故障
NVIDIA GPU 可以为各种类型的 ECC 错误提供错误计数。 一些 ECC 错误是
单比特或双比特,其中单比特错误被纠正,双比特错误
是无法纠正的。 纹理内存错误可以通过重新发送或不可纠正来纠正
如果重发失败。 这些错误可跨两个时间尺度(易失性和
总计的)。 单比特 ECC 错误由硬件自动纠正,不会导致
在数据损坏。 检测到双位错误但未纠正。 请参阅 ECC
有关双位计算应用程序行为信息的 Web 文档
发生错误。 易失性错误计数器跟踪自上次以来检测到的错误数
驱动程序负载。 聚合错误计数无限期地持续存在,因此作为一生
反击。

关于 volatile 计数的说明:在 Windows 上,这是每次启动一次。 在 Linux 上,这可能更多
频繁。 在 Linux 上,当不存在活动客户端时,驱动程序会卸载。 因此,如果
启用持久模式或始终有一个驱动程序客户端处于活动状态(例如 X11),然后
Linux 还会看到每次启动行为。 如果不是,则每次计算时都会重置易失性计数
应用程序运行。

Fermi 和 Kepler 系列的 Tesla 和 Quadro 产品可以显示总 ECC 错误
计数,以及基于芯片位置的错误分类。 地点是
如下面所描述的。 用于汇总错误计数的基于位置的数据需要Inforom ECC
对象版本 2.0。 所有其他 ECC 计数都需要 ECC 对象版本 1.0。

设备 内存 在全局设备内存中检测到错误。

注册 文件 在寄存器文件存储器中检测到错误。

L1 缓存 在 L1 缓存中检测到错误。

L2 缓存 在 L2 缓存中检测到错误。

质地 内存 在纹理内存中检测到奇偶校验错误。

合计 在整个芯片上检测到的总错误。 总和 设备 内存, 注册
文件, L1 缓存, L2 缓存 质地 内存.

温度
板上温度传感器的读数。 所有读数均以摄氏度为单位。 并非全部
产品支持所有阅读类型。 特别是,模块形式的产品会影响
依靠机箱风扇或被动冷却通常不提供温度读数。 看
下面是限制。

GPU 核心 GPU 温度。 适用于所有离散和 S 级产品。

功率
功率读数有助于了解 GPU 的当前功率使用情况,以及影响因素
影响使用。 启用电源管理后,GPU 将功耗限制在
通过操纵电流性能来适应预定义的功率包络
状态。 请参阅下面的可用性限制。

功率 州/领地 电源状态已被弃用并已重命名为性能状态
2.285。 为了保持 XML 兼容性,XML 格式的性能状态是
两个地方都列出来了。

功率 管理
指示是否启用电源管理的标志。 任何一个
“支持”或“不适用”。 需要 Inform PWR 对象版本 3.0 或更高版本或
开普勒装置。

功率 最后测量的整个电路板的功耗,以瓦特为单位。 仅有的
如果支持电源管理,则可用。 这个读数准确到
+/- 5 瓦以内。 需要 Inform PWR 对象版本 3.0 或更高版本或
开普勒装置。

功率 限制 电源管理算法的功率上限,以瓦特为单位。 总板
功率消耗由功率管理算法操纵,以便它
保持在该值以下。 仅在支持电源管理时可用。
需要Inforom PWR 对象版本3.0 或更高版本或Kepler 设备。 在
可以使用 -pl,--power-limit= 调整开普勒设备的功率限制
开关。

默认 功率 限制
默认电源管理算法的功率上限,以瓦特为单位。 力量
卸载驱动程序后,限制将设置回默认功率限制。 仅在
来自 Kepler 系列的支持设备。

分钟 功率 限制
可以将功率限制设置为的最小值(以瓦特为单位)。 仅在
来自 Kepler 系列的支持设备。

max. 功率 限制
可以将功率限制设置为的最大值(以瓦为单位)。 仅在
来自 Kepler 系列的支持设备。


GPU 各部分运行的当前频率。 所有读数均以 MHz 为单位。

图像 图形(着色器)时钟的当前频率。

SM SM(流式多处理器)时钟的当前频率。

内存 内存时钟的当前频率。

应用领域
用户指定的应用程序运行频率。 可以改变
[-ac | --applications-clocks] 开关。

图像 用户指定的图形(着色器)时钟频率。

内存 用户指定的内存时钟频率。

默认 应用领域
应用程序时钟的默认值。 这是将要使用的应用程序时钟
系统重新启动或驱动程序重新加载后。

图像 图形应用程序时钟的默认值(着色器)。

内存 内存时钟的应用时钟的默认值。

max.
GPU 部分设计运行的最大频率。 所有读数均以 MHz 为单位。

图像 图形(着色器)时钟的最大频率。

SM SM(流式多处理器)时钟的最大频率。

内存 内存时钟的最大频率。

支持 时钟
GPU 可以操作的可能内存和图形时钟组合的列表(不是
考虑到 HW 制动减少的时钟)。 这些是唯一的时钟组合
可以传递给 --applications-clocks 标志。 仅当 -q -d 时才列出支持的时钟
SUPPORTED_CLOCKS 开关已提供或以 XML 格式提供。

计算 流程
在设备上具有计算上下文的进程列表。

每个条目的格式为“ . ”

GPU 内存
上下文在设备上使用的内存量。 在 Windows 上不可用
在 WDDM 模式下运行时,因为 Windows KMD 管理所有内存而不是
英伟达驱动程序。

单元 ATTRIBUTES


下面的列表描述了所有可能的数据返回 -q -u 单位查询选项。
除非另有说明,所有数值结果均以 10 为底且无单位。

时间戳
调用 nvidia-smi 时的当前系统时间戳。 格式为“星期几
月日 HH:MM:SS 年”。

驱动器 版本
已安装的 NVIDIA 显示驱动程序的版本。 格式是
“主要号码。次要号码”。

HIC 资料包
有关系统中安装的任何主机接口卡 (HIC) 的信息。

固件 版本
在 HIC 上运行的固件版本。

Units
系统中附加单元的数量。

产品 名字
单位的正式产品名称。 这是一个字母数字值。 适用于所有 S 级
产品。

产品 Id
单位的产品标识符。 这是表单的字母数字值
“第一部分-第二部分-第三部分”。 适用于所有 S 级产品。

产品 串行
单元的不可变全局唯一标识符。 这是一个字母数字值。
适用于所有 S 级产品。

固件 版本
设备上运行的固件版本。 格式为“主要编号.次要编号”。
适用于所有 S 级产品。

搭载了LED 州/领地
LED 指示灯用于标记存在潜在问题的系统。 AMBER的LED颜色
表示有问题。 适用于所有 S 级产品。

颜色 LED 指示灯的颜色。 “绿色”或“琥珀色”。

原因 当前 LED 颜色的原因。 原因可能被列为任何
“未知”、“由主机系统设置为琥珀色”、“热传感器”的组合
故障”、“风扇故障”和“温度超过临界极限”。

温度
设备重要部件的温度读数。 所有读数均以摄氏度为单位。
并非所有读数都可用。 适用于所有 S 级产品。

入学时间 机组进气口的空气温度。

排气 机组排气点的空气温度。

烫衣板 整个单元板的空气温度。

电源供应器
单元电源的读数。 适用于所有 S 级产品。

州/领地 PSU 的运行状态。 电源状态可以是以下任一状态
如下:“正常”、“异常”、“高压”、“风扇故障”、“散热片”
温度”、“电流限制”、“电压低于 UV 警报阈值”、
“低电压”、“I2C 远程关闭命令”、“MOD_DISABLE 输入”或“引脚短路”
过渡”。

电压 PSU 电压设置,单位为伏特。

电流 PSU 电流消耗,以安培为单位。

风扇 资料包
单位的风扇读数。 每个风扇都有一个读数,其中可以有
许多。 适用于所有 S 级产品。

州/领地 风扇的状态,“正常”或“失败”。

迅速的 对于健康的风扇,风扇的转速以 RPM 为单位。

图形处理器
与连接到该单元的每个 GPU 相对应的 PCI 总线 ID 列表。 公交车
id 的格式为“domain:bus:device.function”,以十六进制表示。 适用于所有 S 级产品。

附注


在 Linux 上,如果以 root 身份运行,NVIDIA 设备文件可能会被 nvidia-smi 修改。 请参见
驱动程序自述文件的相关部分。

-a-g 现在不推荐使用参数 -q-i, 分别。 However,然而,
旧参数仍然适用于此版本。

示例


NVIDIA-SMI -q
查询所有 GPU 的属性一次,并以纯文本显示到标准输出。

NVIDIA-SMI -q -d ECC,电源 -i 0 -l 10 -f 输出日志
以0秒的频率查询GPU 10的ECC错误和功耗,
无限期,并记录到文件out.log。

NVIDIA-SMI -c 1 -i GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8
将 UUID 的 GPU 的计算模式设置为“EXCLUSIVE_THREAD”
"GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8".

NVIDIA-SMI -q -u -x --dtd
一次查询所有单元的属性,并以嵌入 DTD 的 XML 格式显示
标准输出。

NVIDIA-SMI --dtd -u -f nvsmi_unit.dtd
将单元 DTD 写入 nvsmi_unit.dtd。

NVIDIA-SMI -q -d 支持时钟
显示所有 GPU 支持的时钟。

NVIDIA-SMI -i 0 --应用程序时钟 2500,745
将应用程序时钟设置为 2500 MHz 内存和 745 MHz 图形。

已知的 问题


- 在 Linux 上,当 X 服务器运行时,计算进程部分中的已用 GPU 内存可能
包含大于实际值的值。 这将在未来修复
释放。

- 在 Linux 上,当存在挂起的 GOM 更改时无法触发 GPU 重置。

- 在 Linux GPU 重置上可能无法成功更改挂起的 ECC 模式。 完全重启可能是
需要启用模式更改。

更改 登录


=== nvidia-smi v4.304 RC 和 v4.304 Production 之间的变化 ===

* 添加了 GPU 操作模式 (GOM) 的报告

* 添加了新的 --gom 开关来设置 GPU 操作模式

=== nvidia-smi v3.295 和 v4.304 RC 之间的变化 ===

* 由于用户反馈重新格式化非详细输出。 删除了待处理的信息
表。

* 如果由于内核模块未接收到初始化失败,打印出有用的消息
中断

* 当系统中不存在 NVML 共享库时更好的错误处理

* 添加了新的 --applications-clocks 开关

* 向 --display 开关添加了新过滤器。 使用 -d SUPPORTED_CLOCKS 运行以列出可能的
GPU 上的时钟

* 报告空闲内存时,从四舍五入的总数和已用内存中计算出来,以便
值加起来

* 添加了电源管理限制约束和默认限制的报告

* 添加了新的 --power-limit 开关

* 添加了纹理内存 ECC 错误的报告

* 添加时钟节流原因报告

=== nvidia-smi v2.285 和 v3.295 之间的变化 ===

* 更清晰的运行命令错误报告(如更改计算模式)

* 在多个 GPU 上同时运行命令时 N/A 错误被视为警告。

* nvidia-smi -i 现在也支持 UUID

* UUID 格式已更改以匹配 UUID 标准,并将报告不同的值。

=== nvidia-smi v2.0 和 v2.285 之间的变化 ===

* 报告 VBIOS 版本。

* 添加 -d/--display 标志来过滤部分数据

* 添加了 PCI 子系统 ID 的报告

* 更新文档以表明我们支持 M2075 和 C2075

* 使用 -u 开关报告 HIC HWBC 固件版本

*报告当前时钟旁边的最大(P0)时钟

* 添加 --dtd 标志以打印设备或单元 DTD

* 添加 NVIDIA 驱动程序未运行时的消息

* 添加了 PCIe 链路生成(最大和当前)和链路宽度(最大和
当前的)。

* 获取挂起的驱动程序模型适用于非管理员

* 添加了对在 Windows 来宾帐户上运行 nvidia-smi 的支持

* 在没有 -q 命令的情况下运行 nvidia-smi 将输出非详细版本的 -q 而不是
帮助

* 修正了 -l/--loop= 参数的解析(默认值,0,到大值)

* 更改了 pciBusId 的格式(更改为 XXXX:XX:XX.X - 此更改在 280 中可见)

* 为 -i 命令解析 busId 的限制较少。 您可以通过 0:2:0.0 或
0000:02:00 和其他变体

* 将版本控制方案更改为还包括“驱动程序版本”

* XML 格式始终符合 DTD,即使出现错误情况

* 添加了对单位和双位 ECC 事件和 XID 错误的支持(默认启用
为 -x 标志禁用 -l 标志)

* 添加了设备重置 -r --gpu-reset 标志

* 添加了计算运行进程列表

* 将电源状态重命名为性能状态。 XML 输出中存在已弃用的支持
只。

* 将 DTD 版本号更新为 2.0 以匹配更新的 XML 输出

使用 onworks.net 服务在线使用 alt-nvidia-304-updates-smi


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad