alt-nvidia-361-smi - 클라우드의 온라인

이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 alt-nvidia-361-smi 명령입니다.

프로그램:

이름


nvidia-smi - NVIDIA 시스템 관리 인터페이스 프로그램

개요


nvidia-smi [옵션1 [ARG1]] [옵션2 [ARG2]] ...

기술


nvidia-smi(또한 NVSMI)는 각각에 대한 모니터링 및 관리 기능을 제공합니다.
Fermi 이상 아키텍처의 NVIDIA Tesla, Quadro, GRID 및 GeForce 장치
가족들. GeForce Titan 시리즈 장치는 매우 제한된 기능으로 대부분의 기능을 지원합니다.
나머지 Geforce 브랜드에 대해 제공된 정보입니다. NVSMI는 크로스 플랫폼입니다.
모든 표준 NVIDIA 드라이버 지원 Linux 배포판과 64비트를 지원하는 도구
Windows Server 2008 R2로 시작하는 Windows 버전. 측정항목을 사용할 수 있습니다.
stdout을 통해 사용자가 직접 또는 스크립팅을 위해 CSV 및 XML 형식을 통해 파일로 제공
목적.

NVSMI의 많은 기능은 기본 NVML C 기반에서 제공됩니다.
도서관. NVML에 대한 자세한 내용은 아래 NVIDIA 개발자 웹 사이트 링크를 참조하십시오.
NVML 기반 Python 바인딩도 사용할 수 있습니다.

NVSMI의 출력은 이전 버전과의 호환성을 보장하지 않습니다. 그러나 NVML과
Python 바인딩은 이전 버전과 호환되며 작성할 때 첫 번째 선택이어야 합니다.
NVIDIA 드라이버 릴리스에서 유지 관리해야 하는 모든 도구.

NVML SDK : http://developer.nvidia.com/nvidia-management-library-nvml/

Python 바인딩: http://pypi.python.org/pypi/nvidia-ml-py/

옵션


일반 옵션
-시간, --도움
사용 정보를 인쇄하고 종료합니다.

개요 옵션
-엘, --리스트-GPUS
시스템의 각 NVIDIA GPU를 UUID와 함께 나열합니다.

질문 옵션
-NS, --질문
GPU 또는 장치 정보를 표시합니다. 표시된 정보에는 (GPU ATTRIBUTES)
또는 (UNIT ATTRIBUTES) 이 문서의 섹션. 일부 장치 및/또는 환경에서는
가능한 모든 정보를 지원합니다. 지원되지 않는 데이터는 "해당 없음"으로 표시됩니다.
산출. 기본적으로 사용 가능한 모든 GPU 또는 장치에 대한 정보가 표시됩니다. 사용 -i
단일 GPU 또는 장치로 출력을 제한하는 옵션입니다.

[을 더한 선택 과목]
-유, --단위
GPU 데이터 대신 단위 데이터를 표시합니다. 단위 데이터는 NVIDIA S-class에만 사용할 수 있습니다.
테슬라 인클로저.

-NS, --id=아이디
지정된 단일 GPU 또는 단위에 대한 데이터를 표시합니다. 지정된 ID는 GPU/장치의
드라이버가 반환하는 자연 열거형의 0부터 시작하는 인덱스, GPU의 보드 직렬
번호, GPU의 UUID 또는 GPU의 PCI 버스 ID(XNUMX진수로 domain:bus:device.function).
일관성을 원하는 사용자는 UUID 또는 PCI 버스 ID를 사용하는 것이 좋습니다.
장치 열거 순서는 재부팅과 보드 간에 일관성이 보장되지 않습니다.
일련 번호는 동일한 보드의 여러 GPU 간에 공유될 수 있습니다.

-f 파일, --파일명=파일
기본 stdout 대신 지정된 파일로 쿼리 출력을 리디렉션합니다. 지정된
파일을 덮어씁니다.

-NS, --xml 형식
사람이 읽을 수 있는 기본 형식 대신 XML 출력을 생성합니다. GPU 및 단위 쿼리 모두
출력은 해당 DTD를 따릅니다. 다음을 통해 사용할 수 있습니다. --dtd 깃발.

--dtd
와 함께 사용 -x. XML 출력에 DTD를 포함합니다.

--디버그=파일
NVIDIA에 버그를 다시 제출하는 데 사용할 암호화된 디버그 로그를 생성합니다.

-d 유형, --디스플레이=유형
선택한 정보만 표시: MEMORY, UTILIZATION, ECC, TEMPERATURE, POWER, CLOCK,
COMPUTE, PIDS, PERFORMANCE, SUPPORTED_CLOCKS, PAGE_RETIREMENT, ACCOUNTING 플래그는 다음과 같습니다.
"MEMORY,ECC"와 같이 쉼표와 결합됩니다. 최대, 최소 및 평균 데이터 샘플링도
POWER, UTILIZATION 및 CLOCK 표시 유형에 대해 반환됩니다. -u/--unit 또는
-x/--xml-형식 플래그.

-l 비서, --루프=SEC
단순히 기본값이 아닌 지정된 간격으로 쿼리 데이터를 지속적으로 보고합니다.
한 번. 애플리케이션은 쿼리 사이에 잠자기 상태가 됩니다. Linux ECC 오류 또는 XID의 경우
오류 이벤트는 다음과 같은 경우 절전 기간 동안 인쇄됩니다. -x 플래그가 지정되지 않았습니다.
언제든지 Ctrl+C를 누르면 루프가 중단되고, 그렇지 않으면 무한정 실행됩니다.
인수가 지정되지 않은 경우 -l 기본 간격인 5초가 사용됩니다.

선택적 질문 옵션
호출자가 쿼리할 속성의 명시적 목록을 전달할 수 있습니다.

[하나 NS]
--쿼리 GPU=
GPU에 대한 정보입니다. 쿼리하려는 속성의 쉼표로 구분된 목록을 전달합니다. 예
--query-gpu=pci.bus_id, 지속성 모드. 자세한 내용은 --help-query-gpu를 호출하십시오.

--쿼리 지원 시계=
지원되는 시계 목록입니다. 자세한 내용은 --help-query-supported-clocks를 호출하십시오.

--쿼리-컴퓨팅-앱=
현재 활성 컴퓨팅 프로세스 목록입니다. 자세한 내용은 --help-query-compute-apps를 호출하십시오.

--쿼리-계정-앱=
계산된 컴퓨팅 프로세스 목록입니다. 자세한 내용은 --help-query-account-apps를 호출하십시오.

--쿼리-은퇴-페이지=
폐기된 GPU 장치 메모리 페이지 목록입니다. --help-query-retired-pages 호출
자세한 정보입니다.

[필수적인]
--형식=
쉼표로 구분된 형식 옵션 목록:

· csv - 쉼표로 구분된 값(필수)

· noheader - 열 머리글이 있는 첫 번째 줄 건너뛰기

· nounits - 숫자 값의 단위를 인쇄하지 않습니다.

[을 더한 어떤 NS]
-NS, --id=아이디
지정된 단일 GPU에 대한 데이터를 표시합니다. 지정된 id는 GPU의 0 기반 인덱스일 수 있습니다.
드라이버가 반환한 자연 열거에서 GPU의 보드 일련 번호,
GPU의 UUID 또는 GPU의 PCI 버스 ID(XNUMX진수로 domain:bus:device.function). 그것은이다
일관성을 원하는 사용자는 UUID 또는 PCI 버스 ID를 사용할 것을 권장합니다.
열거 순서는 재부팅과 보드 직렬 간에 일관성이 보장되지 않습니다.
동일한 보드의 여러 GPU 간에 번호를 공유할 수 있습니다.

-f 파일, --파일명=파일
기본 stdout 대신 지정된 파일로 쿼리 출력을 리디렉션합니다. 지정된
파일을 덮어씁니다.

-l 비서, --루프=SEC
단순히 기본값이 아닌 지정된 간격으로 쿼리 데이터를 지속적으로 보고합니다.
한 번. 애플리케이션은 쿼리 사이에 잠자기 상태가 됩니다. Linux ECC 오류 또는 XID의 경우
오류 이벤트는 다음과 같은 경우 절전 기간 동안 인쇄됩니다. -x 플래그가 지정되지 않았습니다.
언제든지 Ctrl+C를 누르면 루프가 중단되고, 그렇지 않으면 무한정 실행됩니다.
인수가 지정되지 않은 경우 -l 기본 간격인 5초가 사용됩니다.

-작품 ms, --루프-ms=ms
-l,--loop와 동일하지만 밀리초 단위입니다.

장치 변경 옵션
[어느 NS]
-오후, --지속성 모드=모드
대상 GPU에 대한 지속성 모드를 설정합니다. (GPU ATTRIBUTES) 섹션
지속 모드에 대한 설명입니다. 루트가 필요합니다. 단일 GPU가 아닌 경우 모든 GPU에 영향을 미칩니다.
를 사용하여 지정됩니다. -i 논쟁. 이 작업의 효과는 즉각적입니다. 하지만,
재부팅해도 지속되지 않습니다. 각 재부팅 후 지속 모드는 기본적으로
"장애가있는". Linux에서만 사용할 수 있습니다.

-이자형, --ecc-config=구성
대상 GPU에 대한 ECC 모드를 설정합니다. (GPU ATTRIBUTES) 설명 섹션
ECC 모드의. 루트가 필요합니다. 단일 GPU가 다음을 사용하여 지정되지 않는 한 모든 GPU에 영향을 미칩니다.
전에, -i 논쟁. 이 설정은 다음 재부팅 후에 적용되며 영구적입니다.

-NS, --reset-ecc-errors=유형
대상 GPU에 대한 ECC 오류 카운터를 재설정합니다. (GPU ATTRIBUTES) 섹션
ECC 오류 카운터 유형에 대한 설명. 사용 가능한 인수는 0|VOLATILE 또는
1|집계. 루트가 필요합니다. 단일 GPU가 다음을 사용하여 지정되지 않는 한 모든 GPU에 영향을 미칩니다.
전에, -i 논쟁. 이 작업의 효과는 즉각적입니다.

-씨, --컴퓨팅 모드=모드
대상 GPU의 컴퓨팅 모드를 설정합니다. (GPU ATTRIBUTES) 섹션
컴퓨팅 모드에 대한 설명입니다. 루트가 필요합니다. 단일 GPU가 아닌 한 모든 GPU에 영향을 미칩니다.
를 사용하여 지정 -i 논쟁. 이 작업의 효과는 즉각적입니다. 그러나, 그것은
재부팅 후에도 지속되지 않습니다. 재부팅할 때마다 컴퓨팅 모드가 "DEFAULT"로 재설정됩니다.

-DM 유형, --드라이버 모델=유형
-fdm 유형, --force-driver-model=유형
TCC 드라이버 모델을 활성화하거나 비활성화합니다. Windows 전용. 관리자 권한이 필요합니다.
-DM 디스플레이가 부착되면 실패하지만 -fdm 드라이버 모델을 강제로 변경합니다.
단일 GPU가 다음을 사용하여 지정되지 않는 한 모든 GPU에 영향을 미칩니다. -i 논쟁. 재부팅은
변경이 발생하는 데 필요합니다. 보다 운전기사 모델 Windows에 대한 자세한 내용은
드라이버 모델.

--gom=모드
GPU 작동 모드 설정: 0/ALL_ON, 1/COMPUTE, 2/LOW_DP GK110 M-class 및 X-에서 지원됨
Kepler 제품군의 Tesla 제품. Quadro 및 Tesla C 클래스에서는 지원되지 않음
제품. LOW_DP 및 ALL_ON은 GeForce Titan 장치에서 지원되는 유일한 모드입니다.
관리자 권한이 필요합니다. 보다 GPU 조작 모드 GOM에 대한 자세한 내용은
GOM 변경 사항은 재부팅 후 적용됩니다. 재부팅 요구 사항은
미래. 컴퓨팅 전용 GOM은 WDDM(Windows 디스플레이 드라이버 모델)을 지원하지 않습니다.

-NS, --gpu 리셋
GPU 재설정을 트리거합니다. 다음과 같은 상황에서 GPU HW 및 SW 상태를 지우는 데 사용할 수 있습니다.
그렇지 않으면 시스템 재부팅이 필요합니다. 일반적으로 더블 비트 ECC 오류가 있는 경우 유용합니다.
발생했습니다. 필요 -i 대상 특정 장치로 전환합니다. 루트가 필요합니다. 있을 수 없다
이 특정 장치를 사용하는 모든 응용 프로그램(예: CUDA 응용 프로그램, 그래픽 응용 프로그램
X 서버와 같은 nvidia-smi의 다른 인스턴스와 같은 모니터링 응용 프로그램). 거기도
시스템의 다른 GPU에서 실행되는 컴퓨팅 애플리케이션이 될 수 없습니다. 에만
Linux에서 실행되는 Fermi 및 Kepler 제품군의 지원 장치.

GPU 재설정은 모든 경우에 작동하지 않을 수 있습니다. 생산에는 권장되지 않습니다.
이 때의 환경. 경우에 따라 보드에 HW 구성 요소가 있을 수 있습니다.
재설정 요청 후 초기 상태로 되돌리는 데 실패합니다. 이것은 더
Fermi 세대 제품 대 Kepler에서 볼 가능성이 높으며 다음과 같은 경우 더 많이 볼 수 있습니다.
정지된 GPU에서 재설정이 수행되고 있습니다.

재설정 후에는 GPU 상태를 더 이상 확인하기 전에 확인하는 것이 좋습니다.
사용하다. nvidia-healthmon 도구는 이 테스트에 적합합니다. GPU가 건강하지 않은 경우
노드의 전원을 껐다 켜서 완전한 재설정을 시작해야 합니다.

방문 http://developer.nvidia.com/gpu-deployment-kit GDK 및 nvidia를 다운로드하려면
헬스몬.

-악, --applications-clocks=MEM_CLOCK,GRAPHICS_CLOCK
최대값 지정 GPU를 정의하는 쌍으로 클럭(예: 2000,800)
GPU에서 애플리케이션을 실행하는 동안 속도. Kepler+ 제품군의 Tesla 장치 및
Maxwell 기반 GeForce Titan. -acp로 제한이 완화되지 않는 한 루트가 필요합니다.
명령..

-랙, --재설정-응용 프로그램-시계
애플리케이션 시계를 기본값으로 재설정합니다. Kepler+의 Tesla 장치용
제품군 및 Maxwell 기반 GeForce Titan. 제한이 완화되지 않는 한 루트가 필요합니다.
-acp 명령으로.

-acp, --applications-clocks-permission=모드
애플리케이션 시계를 모든 사용자가 변경할 수 있는지 아니면 루트만 변경할 수 있는지 여부를 전환합니다. 사용 가능
인수는 0|UNRESTRICTED, 1|RESTRICTED입니다. Kepler+ 제품군의 Tesla 장치 및
Maxwell 기반 GeForce Titan. 루트가 필요합니다.

-pl, --전력 제한=POWER_LIMIT
최대 전력 제한을 와트로 지정합니다. 정수 및 부동 소수점 숫자를 허용합니다. 오직
Kepler 제품군에서 지원되는 장치에서. 관리자 권한이 필요합니다. 가치 요구
nvidia-smi에서 보고한 Min과 Max Power Limit 사이에 있어야 합니다.

-오전, --accounting-mode=모드
GPU 계정을 활성화하거나 비활성화합니다. GPU 회계를 사용하면 사용량을 추적할 수 있습니다.
단일 프로세스의 수명 동안 리소스. Kepler에서 지원하는 기기에서만
가족. 관리자 권한이 필요합니다. 사용 가능한 인수는 0|DISABLED 또는
1|활성화됨.

-카아, --명확한 설명 앱
지금까지 설명된 모든 프로세스를 지웁니다. Kepler 제품군에서 지원되는 기기에서만 가능합니다.
관리자 권한이 필요합니다.

--auto-boost-default=모드
기본 자동 부스트 정책을 0/DISABLED 또는 1/ENABLED로 설정하여 변경 사항만 적용
마지막 부스트 클라이언트가 종료된 후. Kepler+의 특정 Tesla 장치에서만
제품군 및 Maxwell 기반 GeForce 장치. 루트가 필요합니다.

--auto-boost-default-force=모드
기본 자동 부스트 정책을 0/DISABLED 또는 1/ENABLED로 설정하여 변경 사항을 적용합니다.
즉시. Kepler+ 제품군 및 Maxwell 기반의 특정 Tesla 장치에서만
지포스 장치. 루트가 필요합니다.

--auto-boost-permission=모드
자동 부스트 모드에 대한 비관리자/루트 제어를 허용합니다. 사용 가능한 인수는 다음과 같습니다.
0|제한 없음, 1|제한됨. Kepler+ 제품군의 특정 Tesla 장치에만 해당되며
Maxwell 기반 GeForce 장치. 루트가 필요합니다.

[을 더한 선택 과목]
-NS, --id=아이디
지정된 단일 GPU를 수정합니다. 지정된 id는 GPU/Unit의 0 기반 인덱스일 수 있습니다.
드라이버가 반환한 자연 열거, GPU의 보드 일련 번호, GPU의
UUID 또는 GPU의 PCI 버스 ID(XNUMX진수로 domain:bus:device.function). 그것을 추천합니다
일관성을 원하는 사용자는 UUID 또는 PCI 버스 ID를 사용합니다.
재부팅 사이에 순서가 일관성이 있다고 보장되지 않으며 보드 일련 번호가
동일한 보드의 여러 GPU 간에 공유할 수 있습니다.

UNIT 변경 옵션
-NS, --toggle-led=상태
기기 전면과 후면의 LED 표시등 상태를 지정된 색상으로 설정합니다. 보다
(UNIT ATTRIBUTES) LED 상태에 대한 설명은 섹션을 참조하십시오. 허용되는 색상은
0|녹색 및 1|황색. 루트가 필요합니다.

[을 더한 선택 과목]
-NS, --id=아이디
지정된 단일 단위를 수정합니다. 지정된 id는 단위의 0부터 시작하는 인덱스입니다.
드라이버가 반환한 자연 열거입니다.

표시 DTD 옵션
--dtd
디스플레이 장치 또는 단위 DTD.

[을 더한 선택 과목]
-f 파일, --파일명=파일
기본 stdout 대신 지정된 파일로 쿼리 출력을 리디렉션합니다. 지정된
파일을 덮어씁니다.

-유, --단위
장치 DTD 대신 디스플레이 단위 DTD.

통계
GPU에 대한 통계 정보를 표시합니다. 자세한 내용은 "nvidia-smi stats -h"를 사용하십시오.
정보. 리눅스 전용.

topo
시스템에 대한 토폴로지 정보를 표시합니다. 자세한 내용은 "nvidia-smi topo -h"를 사용하십시오.
정보. 리눅스 전용. NVML이 감지할 수 있지만 CPU 선호도가 있는 모든 GPU를 표시합니다.
Kepler 또는 최신 아키텍처가 있는 GPU에 대해서만 정보가 표시됩니다. 참고: GPU
열거형은 NVML과 동일합니다.

배수
GPU 드레인 상태를 표시하고 수정합니다. 자세한 내용은 "nvidia-smi drain -h"를 사용하십시오.
리눅스 전용.

nvlink
nvlink 정보를 표시합니다. 자세한 내용은 "nvidia-smi nvlink -h"를 사용하십시오.

시계
클러킹 동작을 쿼리하고 제어합니다. 현재 이것은 동기화된 부스트에만 해당됩니다.
자세한 내용은 "nvidia-smi clocks --help"를 사용하십시오.

RETURN VALUE


반환 코드는 작업의 성공 또는 실패 여부와 그 이유를 반영합니다.
실패.

· 반환 코드 0 - 성공

· 반환 코드 2 - 제공된 인수 또는 플래그가 잘못되었습니다.

· 반환 코드 3 - 요청한 작업은 대상 장치에서 사용할 수 없습니다.

· 반환 코드 4 - 현재 사용자는 이 장치에 액세스할 수 있는 권한이 없거나
이 작업을 수행

· 반환 코드 6 - 개체를 찾는 쿼리가 실패했습니다.

· 반환 코드 8 - 장치의 외부 전원 케이블이 제대로 연결되지 않았습니다.

· 반환 코드 9 - NVIDIA 드라이버가 로드되지 않음

· 반환 코드 10 - NVIDIA 커널이 GPU에서 인터럽트 문제를 감지했습니다.

· 반환 코드 12 - NVML 공유 라이브러리를 찾거나 로드할 수 없습니다.

· 반환 코드 13 - NVML의 로컬 버전은 이 기능을 구현하지 않습니다.

· 반환 코드 14 - infoROM이 손상되었습니다.

· 반환 코드 15 - GPU가 버스에서 떨어지거나
액세스

· 반환 코드 255 - 기타 오류 또는 내부 드라이버 오류가 발생했습니다.

GPU ATTRIBUTES


다음 목록은 에서 반환된 가능한 모든 데이터를 설명합니다. -q 장치 쿼리 옵션.
달리 명시되지 않는 한 모든 수치 결과는 밑이 10이고 단위가 없습니다.

시간 기록
nvidia-smi가 호출된 시점의 현재 시스템 타임스탬프입니다. 형식은 "요일
월 일 HH:MM:SS 연도".

운전기사 버전
설치된 NVIDIA 디스플레이 드라이버의 버전입니다. 이것은 영숫자 문자열입니다.

첨부 GPU
시스템의 NVIDIA GPU 수입니다.

프로덕트 성함
GPU의 공식 제품 이름입니다. 이것은 영숫자 문자열입니다. 모든 제품.

디스플레이 모드
물리적 디스플레이(예: 모니터)가 현재 연결되어 있는지 여부를 나타내는 플래그
GPU의 커넥터 중 하나. "활성화됨"은 연결된 디스플레이를 나타냅니다. "장애가있는"
달리 나타냅니다.

디스플레이 최근활동
디스플레이가 GPU에서 초기화되었는지 여부를 나타내는 플래그(예: 메모리가
표시를 위해 장치에 할당됨). 모니터가 없는 경우에도 디스플레이를 활성화할 수 있습니다.
물리적으로 붙어 있습니다. "활성화됨"은 활성 디스플레이를 나타냅니다. "비활성화됨"은
그렇지 않으면.

고집 모드
GPU에 대해 지속성 모드가 활성화되었는지 여부를 나타내는 플래그입니다. 값은 다음 중 하나입니다.
"활성화됨" 또는 "비활성화됨". 지속성 모드가 활성화되면 NVIDIA 드라이버가 유지됩니다.
X11 또는 nvidia-smi와 같은 활성 클라이언트가 없는 경우에도 로드됩니다. 이것은 최소화
CUDA 프로그램과 같은 종속 앱 실행과 관련된 드라이버 로드 대기 시간. 을위한
모든 CUDA 지원 제품. 리눅스 전용.

회계 모드
GPU 값에 대해 계정 모드가 활성화되었는지 여부를 나타내는 플래그는 다음 중 하나입니다.
회계가 활성화된 상태에서 실행 중인 각 컴퓨팅 프로세스에 대해 통계가 계산됩니다.
GPU. 통계는 수명 기간 동안 또는 프로세스 종료 후에 쿼리할 수 있습니다.
프로세스가 실행 상태에 있는 동안 프로세스의 실행 시간은 0으로 보고되고
프로세스가 종료된 후 실제 실행 시간으로 업데이트됩니다. --help-query-를 참조하십시오.
자세한 내용은 계정 앱을 참조하세요.

회계 모드 버퍼 크기
쿼리할 수 있는 프로세스 목록을 보유하는 순환 버퍼의 크기를 반환합니다.
회계 통계를 위해. 회계 정보가 처리하는 최대 프로세스 수입니다.
가장 오래된 프로세스에 대한 정보를 덮어 쓰기 전에 저장됩니다.
새로운 프로세스에 대한 정보.

운전기사 모델
Windows에서는 TCC 및 WDDM 드라이버 모델이 지원됩니다. 드라이버 모델 변경 가능
이랑 (-DM) 또는 (-fdm) 플래그. TCC 드라이버 모델은 컴퓨팅에 최적화되어 있습니다.
응용 프로그램. TCC를 사용하면 IE 커널 실행 시간이 더 빨라집니다. WDDM 드라이버 모델
그래픽 응용 프로그램용으로 설계되었으며 컴퓨팅 응용 프로그램에는 권장되지 않습니다.
Linux는 여러 드라이버 모델을 지원하지 않으며 항상 "N/A" 값을 갖습니다.

Current 현재 사용 중인 드라이버 모델입니다. Linux에서는 항상 "해당 사항 없음"입니다.

대기중 다음에 재부팅할 때 사용할 드라이버 모델입니다. 항상 "해당 사항 없음" 켜짐
리눅스.

일련의 번호
이 번호는 각 보드에 물리적으로 인쇄된 일련 번호와 일치합니다. 이는 전 세계적으로
고유한 변경할 수 없는 영숫자 값입니다.

GPU UUID
이 값은 GPU의 전역적으로 고유한 변경할 수 없는 영숫자 식별자입니다. 그렇습니다
보드의 물리적 레이블과 일치하지 않습니다.

미성년자 번호
장치의 부 번호는 각 GPU에 대한 Nvidia 장치 노드 파일이
형식은 /dev/nvidia[부 번호]입니다. Linux 플랫폼에서만 사용할 수 있습니다.

VBIOS 버전
GPU 보드의 BIOS.

멀티 GPU 교육 위원회
이 GPU가 multiGPU 보드의 일부인지 여부입니다.

교육 위원회 ID
드라이버가 할당한 고유한 보드 ID입니다. XNUMX개 이상의 GPU가 동일한 보드 ID를 갖는 경우
위의 "MultiGPU" 필드가 true이면 GPU가 동일한 보드에 있는 것입니다.

정보 버전
GPU 보드의 정보 저장소에 있는 각 개체의 버전 번호입니다. 정보는
GPU에 대한 구성 및 상태 데이터의 작고 영구적인 저장소입니다. 모든 정보 버전
필드는 숫자입니다. 일부 GPU가 있기 때문에 이러한 버전 번호를 아는 것이 유용할 수 있습니다.
기능은 특정 버전 이상의 정보에서만 사용할 수 있습니다.

아래 필드 중 하나라도 알 수 없는 오류를 반환하는 경우 추가 정보 확인 확인은
수행되고 적절한 경고 메시지가 표시됩니다.

영상 버전 infoROM 이미지의 글로벌 버전입니다. VBIOS 버전과 같은 이미지 버전
보드에 플래시된 infoROM의 정확한 버전을 고유하게 설명합니다.
지원되는 지표일 뿐인 infoROM 객체 버전과 대조
기능을 제공합니다.

OEM 목적 OEM 구성 데이터의 버전입니다.

ECC 목적 ECC 기록 데이터의 버전입니다.

출력 목적 전원 관리 데이터의 버전입니다.

GPU 조작 모드
GOM을 사용하면 GPU 기능을 비활성화하여 전력 사용량을 줄이고 GPU 처리량을 최적화할 수 있습니다.

각 GOM은 특정 사용자 요구를 충족하도록 설계되었습니다.

"All On" 모드에서는 모든 것이 활성화되고 최고 속도로 실행됩니다.

"계산" 모드는 연산 작업만 실행하도록 설계되었습니다. 그래픽 작업은
수있었습니다.

"낮은 배정밀도" 모드는 그렇지 않은 그래픽 응용 프로그램을 실행하도록 설계되었습니다.
고대역폭 배정밀도가 필요합니다.

GOM은 (--곰) 깃발.

Kepler 제품군의 GK110 M 클래스 및 X 클래스 Tesla 제품에서 지원됩니다. 아니다
Quadro 및 Tesla C 클래스 제품에서 지원됩니다. 낮은 배정밀도 및 모두 켜기 모드는
지원되는 GeForce Titan 제품에 사용할 수 있는 유일한 모드입니다.

Current 현재 사용 중인 GOM입니다.

대기중 다음에 재부팅할 때 사용할 GOM입니다.

PCI
장치에 대한 기본 PCI 정보입니다. 이 정보 중 일부는 카드가
시스템에서 추가/제거/이동. 모든 제품.

버스 PCI 버스 번호(XNUMX진수)

장치 PCI 장치 번호(XNUMX진수)

도메인 PCI 도메인 번호(XNUMX진수)

장치 Id PCI 공급업체 장치 ID(XNUMX진수)

서브 Id PCI 하위 시스템 ID(XNUMX진수)

버스 Id PCI 버스 ID는 "도메인:버스:장치.기능"으로, XNUMX진수로 표시됩니다.

GPU (링크) 정보
PCIe 링크 생성 및 버스 폭

Current 현재 링크 생성 및 너비입니다. GPU가
사용중이 아닙니다.

최고 이 GPU 및 시스템에서 가능한 최대 링크 생성 및 너비
구성. 예를 들어 GPU가 더 높은 PCIe 세대를 지원하는 경우
시스템이 지원하는 것보다 많으면 시스템 PCIe 생성이 보고됩니다.

다리 Chip
장치의 Bridge Chip과 관련된 정보입니다. 브리지 칩 펌웨어만 있습니다.
특정 보드에서는 사용할 수 없으며 일부 최신 multiGPU 보드에서는 "N/A"가 표시될 수 있습니다.

타입 브리지 칩의 유형입니다. 존재하지 않는 경우 N/A로 보고됩니다.

펌웨어 버전
브리지 칩의 펌웨어 버전입니다. 존재하지 않는 경우 N/A로 보고됩니다.

재생 카운터
PCIe 버스의 다양한 오류를 기록하는 내부 카운터입니다.

Tx 처리량
지난 20ms 동안 PCIe 버스를 통한 GPU 중심 전송 처리량(MB/s)입니다.
Maxwell 아키텍처 이상에서만 지원됩니다.

Rx 처리량
GPU 중심은 PCIe 버스에서 지난 20ms 동안 MB/s 단위의 수신 처리량을 수신합니다. 오직
Maxwell 아키텍처 이상에서 지원됩니다.

부채 속도
팬 속도 값은 현재 장치의 팬이 작동하는 최대 속도의 백분율입니다.
에서 실행할 예정입니다. 범위는 0~100%입니다. 참고: 보고된 속도는 의도한 것입니다.
팬 속도. 팬이 물리적으로 차단되어 회전할 수 없는 경우 이 출력은
실제 팬 속도와 일치합니다. 많은 부품이 팬 속도에 의존하기 때문에 보고하지 않습니다.
주변 인클로저의 팬을 통한 냉각. 전용 기능이 있는 모든 개별 제품용
팬.

퍼포먼스 주 정부
GPU의 현재 성능 상태입니다. 상태 범위는 P0(최대 성능)에서
P12(최소 성능).

시계 조절판 이유
클록의 빈도를 줄이는 요인에 대한 정보를 검색합니다. 에만
Kepler 제품군에서 지원되는 Tesla 장치.

모든 스로틀 이유가 "비활성"으로 반환되면 시계가 다음과 같이 실행되고 있음을 의미합니다.
가능한 높은.

유휴 GPU에서 실행 중인 것이 없고 클록이 유휴 상태로 떨어지고 있습니다.
이 제한기는 이후 릴리스에서 제거될 수 있습니다.

어플리케이션 시계 환경
GPU 클럭은 애플리케이션 클럭 설정에 의해 제한됩니다. 예를 들어 변경할 수 있습니다
nvidia-smi --applications-clocks= 사용

SW 출력 SW Power Scaling 알고리즘은 요청된 클럭 아래로 클럭을 줄입니다.
GPU가 너무 많은 전력을 소비하기 때문입니다. 예: SW 전력 캡 한도는
nvidia-smi --power-limit=로 변경

HW 천천히 해 HW Slowdown(코어 클럭을 2배 이상 감소)이 작동 중입니다.

이것은 다음을 나타내는 지표입니다.
* 온도가 너무 높음
* 외부 전원 브레이크 설정이 트리거됩니다(예: 시스템 전원에 의해
공급)
* 전력 소모가 너무 높고 Fast Trigger 보호로 인해 클럭이 감소합니다.

알 수 없는 다른 불특정 요인은 시계를 줄이는 것입니다.

FB 메모리 용법
온보드 프레임 버퍼 메모리 정보. 보고된 총 메모리는 ECC 상태의 영향을 받습니다.
ECC가 활성화되면 사용 가능한 총 메모리가 몇 퍼센트 감소합니다.
필수 패리티 비트. 드라이버는 내부 메모리를 위해 소량의 메모리를 예약할 수도 있습니다.
GPU에 대한 활성 작업 없이도 사용할 수 있습니다. 모든 제품.

금액 FB 메모리의 전체 크기입니다.

사용 된 사용된 FB 메모리 크기입니다.

무료 FB 메모리의 사용 가능한 크기입니다.

바1 메모리 용법
BAR1은 CPU에서 직접 액세스할 수 있도록 FB(장치 메모리)를 매핑하는 데 사용됩니다.
또는 타사 장치(PCIe 버스의 피어 투 피어).

금액 BAR1 메모리의 총 크기입니다.

사용 된 BAR1 메모리의 사용된 크기입니다.

무료 BAR1 메모리의 사용 가능한 크기입니다.

계산 모드
컴퓨팅 모드 플래그는 개별 또는 여러 컴퓨팅 애플리케이션이
GPU에서 실행합니다.

"기본값"은 장치당 여러 컨텍스트가 허용됨을 의미합니다.

"독점 프로세스"는 장치당 하나의 컨텍스트만 허용되며 여러 장치에서 사용할 수 있음을 의미합니다.
한 번에 스레드.

"금지됨"은 장치당 허용되는 컨텍스트가 없음을 의미합니다(컴퓨팅 앱 없음).

"EXCLUSIVE_PROCESS"가 CUDA 4.0에 추가되었습니다. 이전 CUDA 릴리스는 하나만 지원했습니다.
CUDA 4.0 이상에서 "EXCLUSIVE_THREAD"에 해당하는 단독 모드입니다.

모든 CUDA 지원 제품용.

이용
활용률은 각 GPU가 시간이 지남에 따라 얼마나 바쁜지를 보고하고 어떻게
많은 응용 프로그램이 시스템의 GPU를 사용하고 있습니다.

참고: ECC가 활성화된 경우 드라이버 초기화 중에 높은 GPU 및 메모리를 볼 수 있습니다.
활용도 수치. 이것은 수행되는 ECC 메모리 스크러빙 메커니즘으로 인해 발생합니다.
드라이버 초기화 중.

GPU 과거 샘플 기간 동안 하나 이상의 시간 비율
커널이 GPU에서 실행 중이었습니다. 샘플 기간은 1 사이일 수 있습니다.
제품에 따라 초 및 1/6초.

메모리 지난 샘플 기간 동안 글로벌(기기) 시간 비율
메모리를 읽거나 쓰고 있었습니다. 샘플 기간은 1 사이일 수 있습니다.
제품에 따라 초 및 1/6초.

인코더 GPU의 비디오가 지난 샘플 기간 동안의 시간 비율
인코더를 사용 중이었습니다. 샘플링 속도는 가변적이며 다음을 얻을 수 있습니다.
nvmlDeviceGetEncoderUtilization() API를 통해 직접

디코더 GPU의 비디오가 지난 샘플 기간 동안의 시간 비율
디코더를 사용 중이었습니다. 샘플링 속도는 가변적이며 다음을 얻을 수 있습니다.
nvmlDeviceGetDecoderUtilization() API를 통해 직접

Ecc 모드
ECC 지원이 활성화되었는지 여부를 나타내는 플래그입니다. "활성화" 또는
"장애가있는". ECC 모드로 변경하려면 재부팅해야 합니다. Inforom ECC 개체 버전 필요
1.0 이상.

Current GPU가 현재 작동 중인 ECC 모드입니다.

대기중 다음 재부팅 후 GPU가 작동할 ECC 모드입니다.

ECC 오류
NVIDIA GPU는 다양한 유형의 ECC 오류에 대한 오류 수를 제공할 수 있습니다. 일부 ECC 오류는
단일 비트 또는 이중 비트(단일 비트 오류가 수정되고 이중 비트 오류가 수정됨)
수정할 수 없습니다. 텍스처 메모리 오류는 재전송을 통해 수정 가능하거나 수정 불가능할 수 있습니다.
재전송이 실패하는 경우. 이러한 오류는 두 가지 시간 척도(휘발성 및
골재). 단일 비트 ECC 오류는 HW에 의해 자동으로 수정되며 결과가 발생하지 않습니다.
데이터 손상. 더블 비트 오류가 감지되었지만 수정되지 않았습니다. ECC를 참조하십시오
더블 비트일 때 컴퓨팅 애플리케이션 동작에 대한 정보는 웹 문서
오류가 발생합니다. 휘발성 오류 카운터는 마지막 이후 감지된 오류 수를 추적합니다.
드라이버 로드. 집계 오류 수는 무기한 지속되므로 수명으로 작동합니다.
카운터.

휘발성 수에 대한 참고 사항: Windows에서는 부팅당 한 번입니다. Linux에서는 더 많을 수 있습니다.
잦은. Linux에서 활성 클라이언트가 없을 때 드라이버가 언로드됩니다. 따라서 만약
지속성 모드가 활성화되어 있거나 항상 활성 상태인 드라이버 클라이언트(예: X11)가 있는 경우
Linux는 또한 부팅별 동작을 봅니다. 그렇지 않은 경우 휘발성 카운트는 계산할 때마다 재설정됩니다.
앱이 실행됩니다.

Fermi 및 Kepler 제품군의 Tesla 및 Quadro 제품은 총 ECC 오류를 표시할 수 있습니다.
카운트뿐만 아니라 칩의 위치를 ​​기반으로 한 오류 분석. 위치는
아래에서 묘사 되어진. 집계 오류 수에 대한 위치 기반 데이터에는 Inforom ECC가 필요합니다.
개체 버전 2.0. 다른 모든 ECC 카운트에는 ECC 개체 버전 1.0이 필요합니다.

장치 메모리 전역 장치 메모리에서 오류가 감지되었습니다.

회원가입 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에 레지스터 파일 메모리에서 오류가 감지되었습니다.

L1 캐시 L1 캐시에서 오류가 감지되었습니다.

L2 캐시 L2 캐시에서 오류가 감지되었습니다.

조직 메모리 텍스처 메모리에서 패리티 오류가 감지되었습니다.

금액 전체 칩에서 감지된 총 오류입니다. 의 합 장치 메모리, 회원가입
입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에, L1 캐시, L2 캐시조직 메모리.

페이지 퇴직
NVIDIA GPU는 신뢰할 수 없는 GPU 장치 메모리 페이지를 폐기할 수 있습니다. 이것은 할 수 있습니다
동일한 페이지 또는 이중 비트 ECC에 대해 여러 개의 단일 비트 ECC 오류가 발생할 때 발생
오류. 페이지가 폐기되면 NVIDIA 드라이버는 드라이버가 없도록 페이지를 숨깁니다.
응용 프로그램 메모리 할당이 액세스할 수 있습니다.

비트 ECC 다음으로 인해 폐기된 GPU 장치 메모리 페이지 수
더블 비트 ECC 오류.

하나의 비트 ECC 다음으로 인해 폐기된 GPU 장치 메모리 페이지 수
다중 단일 비트 ECC 오류.

대기중 다음 재부팅 시 폐기 보류 중인 GPU 장치 메모리 페이지가 있는지 확인합니다.
폐기 보류 중인 페이지는 여전히 할당될 수 있으며 추가로 발생할 수 있습니다.
신뢰성 문제.

온도
보드에 있는 온도 센서의 판독값. 모든 판독값은 C도입니다. 전부는 아닙니다.
제품은 모든 읽기 유형을 지원합니다. 특히 모듈 형태의 제품은
케이스 팬에 의존하거나 수동 냉각은 일반적으로 온도 판독값을 제공하지 않습니다. 보다
아래에 제한 사항이 있습니다.

GPU 코어 GPU 온도. 모든 디스크리트 및 S-클래스 제품용.

종료 온도 GPU가 종료되는 온도입니다.

천천히 해 온도 GPU가 속도를 줄이기 시작하는 온도
멋지다.

출력 판독
전력 판독값은 GPU의 현재 전력 사용량과 요인을 밝히는 데 도움이 됩니다.
그 사용법에 영향을 미칩니다. 전원 관리가 활성화되면 GPU는 전력 소모를 제한합니다.
현재 성능을 조작하여 미리 정의된 전력 엔벨로프에 맞게 부하
상태. 가용성 제한은 아래를 참조하십시오.

출력 주 정부 전원 상태는 더 이상 사용되지 않으며 에서 성능 상태로 이름이 변경되었습니다.
2.285. XML 호환성을 유지하기 위해 XML 형식의 성능 상태는
두 곳에 모두 기재되어 있습니다.

출력
전원 관리가 활성화되었는지 여부를 나타내는 플래그입니다. 어느 하나
"지원됨" 또는 "해당 사항 없음". Inforom PWR 개체 버전 3.0 이상이 필요합니다.
케플러 장치.

출력 그리기 전체 보드에 대해 마지막으로 측정된 전력 소비량(와트)입니다. 오직
전원 관리가 지원되는 경우 사용할 수 있습니다. 이 판독값은 다음과 같이 정확합니다.
+/- 5와트 이내. Inforom PWR 개체 버전 3.0 이상이 필요합니다.
케플러 장치.

출력 한도 소프트웨어 전력 제한(와트). nvidia-smi와 같은 소프트웨어로 설정합니다.
전원 관리가 지원되는 경우에만 사용할 수 있습니다. PWR 정보 필요
개체 버전 3.0 이상 또는 Kepler 장치. Kepler 장치 전원
제한은 -pl,--power-limit= 스위치를 사용하여 조정할 수 있습니다.

강제 출력 한도
전력 관리 알고리즘의 전력 한도(와트)입니다. 총 보드
전력 소비는 전력 관리 알고리즘에 의해 조작됩니다.
이 값 아래에 유지됩니다. 이 제한은 다음과 같은 다양한 제한의 최소값입니다.
위에 나열된 소프트웨어 제한으로. 전원 관리가 있는 경우에만 사용 가능
지원. 케플러 장치가 필요합니다.

태만 출력 한도
기본 전원 관리 알고리즘의 전원 한도(와트)입니다. 힘
제한은 드라이버 언로드 후 기본 전력 제한으로 다시 설정됩니다. 에만
Kepler 제품군에서 지원되는 장치.

Min 출력 한도
전력 제한을 설정할 수 있는 최소값(와트)입니다. 에만
Kepler 제품군에서 지원되는 장치.

Max 출력 한도
전력 제한을 설정할 수 있는 최대값(와트)입니다. 에만
Kepler 제품군에서 지원되는 장치.

시계
GPU의 일부가 실행되고 있는 현재 주파수입니다. 모든 판독값은 MHz 단위입니다.

그래픽 업로드 그래픽(셰이더) 클럭의 현재 주파수입니다.

SM SM(Streaming Multiprocessor) 클럭의 현재 주파수입니다.

메모리 메모리 클럭의 현재 주파수.

Video 비디오(인코더 + 디코더) 클럭의 현재 주파수입니다.

어플리케이션 시계
응용 프로그램이 실행될 사용자 지정 빈도입니다. 로 변경할 수 있습니다.
[-ac | --applications-clocks] 스위치.

그래픽 업로드 그래픽(셰이더) 클럭의 사용자 지정 주파수입니다.

메모리 메모리 클럭의 사용자 지정 주파수.

태만 어플리케이션 시계
응용 프로그램이 실행될 기본 빈도입니다. 애플리케이션 시계는 다음과 같습니다.
[-ac | --applications-clocks] 스위치. 애플리케이션 시계는 다음으로 설정할 수 있습니다.
기본값은 [-rac | --reset-applications-clocks] 스위치.

그래픽 업로드 응용 프로그램 그래픽(셰이더) 클럭의 기본 주파수입니다.

메모리 애플리케이션 메모리 클럭의 기본 주파수.

Max 시계
GPU의 일부가 실행되도록 설계된 최대 주파수입니다. 모든 판독값은 MHz 단위입니다.

Fermi 제품군의 GPU에서 현재 P0 클럭(클럭 섹션에 보고됨)은 다음과 다를 수 있습니다.
몇 MHz의 최대 클록.

그래픽 업로드 그래픽(셰이더) 클럭의 최대 주파수.

SM SM(Streaming Multiprocessor) 클럭의 최대 주파수.

메모리 메모리 클럭의 최대 주파수.

Video 비디오(인코더 + 디코더) 클럭의 최대 주파수.

시계 정책
자동 부스트와 같은 자동 클럭 변경에 대한 사용자 지정 설정.

자동차 상승 현재 이 GPU에 대해 자동 부스트 모드가 활성화되어 있는지(켜기) 또는
이 GPU에 대해 비활성화되었습니다(Off). 부스트가 지원되지 않는 경우 표시(해당 없음). 자동
boost는 전력, 열 및 활용도를 기반으로 하는 동적 GPU 클러킹을 허용합니다.
자동 부스트가 비활성화되면 GPU는 다음에서 클럭을 유지하려고 시도합니다.
정확하게 현재 애플리케이션 클록 설정(CUDA 컨텍스트가
활성). 자동 부스트가 활성화된 상태에서 GPU는 계속 유지하려고 시도합니다.
이 플로어에 있지만 전원이 공급되면 기회적으로 더 높은 클럭으로 부스트됩니다.
열 및 활용 헤드룸이 허용됩니다. 이 설정은 평생 지속됩니다.
요청된 CUDA 컨텍스트. 앱에서 요청할 수 있음
NVML 호출(NVML SDK 참조)을 통해 또는
CUDA 환경 변수 CUDA_AUTO_BOOST.

자동차 상승 태만
활성화(켜기) 또는 자동 부스트 모드의 기본 설정을 나타냅니다.
비활성화됨(끄기). 부스트가 지원되지 않는 경우 표시(해당 없음). 앱은 다음에서 실행됩니다.
특정 모드를 명시적으로 요청하지 않은 경우 기본 모드입니다. 메모:
자동 부스트 설정은 "지속성 모드"가 활성화된 경우에만 수정할 수 있으며,
기본적으로는 그렇지 않습니다.

지원 시계
GPU가 작동할 수 있는 가능한 메모리 및 그래픽 클록 조합 목록(
HW 브레이크 감소 클록 고려). 다음은 유일한 시계 조합입니다.
--applications-clocks 플래그에 전달할 수 있습니다. 지원되는 시계는 -q -d일 때만 나열됩니다.
SUPPORTED_CLOCKS 스위치가 제공되거나 XML 형식으로 제공됩니다.

프로세스
장치에 컴퓨팅 또는 그래픽 컨텍스트가 있는 프로세스 목록입니다. 컴퓨팅 프로세스는
완전히 지원되는 모든 제품에 대해 보고됩니다. 그래픽 프로세스에 대한 보고가 제한됨
Kepler 아키텍처로 시작하는 지원되는 제품에

각 항목의 형식은 " "

GPU 색인 장치의 NVML 인덱스를 나타냅니다.

PID 활성 컴퓨팅 또는 그래픽에 해당하는 프로세스 ID를 나타냅니다.
문맥.

타입 계산 프로세스의 경우 "C", 그래픽 프로세스의 경우 "G" 및 "C+G"로 표시됩니다.
Compute 및 Graphics 컨텍스트가 모두 있는 프로세스의 경우.

방법 성함 Compute 또는 Graphics 프로세스의 프로세스 이름을 나타냅니다.

GPU 메모리 용법
컨텍스트에 의해 장치에서 사용된 메모리의 양입니다. 사용할 수 없음
Windows KMD가 모든
NVIDIA 드라이버가 아닌 메모리.

통계 (실험적)
전력 샘플, 사용률 샘플, xid 이벤트, 클럭 변경과 같은 GPU 통계 나열
이벤트 및 위반 카운터.

Linux에서 Tesla, GRID 및 Quadro 기반 제품에서 지원됩니다.

Kepler 또는 최신 GPU로 제한됩니다.

다음과 같이 CSV 형식으로 통계를 표시합니다.

, , ,

단위와 함께 표시할 측정항목은 다음과 같습니다.

전력 샘플(와트).

GPU 온도 샘플(섭씨).

백분율로 표시되는 GPU, 메모리, 인코더 및 디코더 사용률 샘플.

Xid 오류 코드와 함께 보고된 Xid 오류 이벤트. 알 수 없는 xid에 대한 오류 코드는 999입니다.
오류.

프로세서 및 메모리 클록은 MHz 단위로 변경됩니다.

ns 단위의 위반 시간이 있는 전력 상한으로 인한 위반입니다. (테슬라 전용)

위반 부울 플래그(1/0)가 있는 열 캡핑으로 인한 위반입니다. (테슬라 전용)

배송 시 요청 사항:

"#" 앞에 오는 모든 통계는 주석입니다.

지원되지 않는 장치는 "#으로 표시됩니다. , 지원되지 않는 장치".

지원되지 않는 측정항목은 " , , N/A, N/A".

열/전력으로 인한 위반은 Tesla 기반 제품에만 지원됩니다. 열 위반
Tesla K20 이상으로 제한됩니다.

장치 모니터링
"nvidia-smi dmon" 명령줄은 하나 이상의 GPU(최대 4개 장치)를 모니터링하는 데 사용됩니다.
시스템에 연결했습니다. 이 도구를 사용하면 사용자는 당 한 줄의 모니터링 데이터를 볼 수 있습니다.
모니터링 주기. 출력은 간결한 형식이며 대화식으로 해석하기 쉽습니다.
방법. 라인당 출력 데이터는 터미널 크기에 따라 제한됩니다. Tesla에서 지원되며,
베어 메탈 64에서 Kepler 또는 최신 GPU용 GRID, Quadro 및 제한된 GeForce 제품
비트 리눅스. 기본적으로 모니터링 데이터에는 전력 사용량, 온도, SM 시계,
SM, 메모리, 인코더 및 디코더에 대한 메모리 클럭 및 활용도 값. 그것은 또한 될 수 있습니다
프레임 버퍼 메모리 사용량, bar1 메모리 사용량,
전력/열 위반 및 집계 단일/이중 비트 ECC 오류. 메트릭 중 하나라도
장치에서 지원되지 않거나 메트릭을 가져올 때 다른 오류가 다음과 같이 보고됩니다.
"-"는 출력 데이터에 있습니다. 사용자는 또한 모니터링 빈도와 수를 구성할 수 있습니다.
각 실행에 대한 모니터링 반복. 날짜와 시간을 포함하는 옵션도 있습니다.
각 라인. 지원되는 모든 옵션은 배타적이며 어떤 순서로든 함께 사용할 수 있습니다.

용법:

1) 태만 아니 인수

엔비디아 smi 드몬

자연 열거(시작
0초의 빈도로 GPU 인덱스 1). ^C로 종료될 때까지 실행됩니다.

2) 선택 or 배우기 장치

엔비디아 smi 드몬 -i <장치1,장치2, .. , 장치N>

쉼표로 구분된 장치 목록으로 선택한 장치에 대한 기본 메트릭을 보고합니다. 도구
자연 열거 아래 목록에서 지원되는 장치를 최대 4개 선택합니다(GPU부터 시작).
인덱스 0).

3) 선택 통계 be 표시된

엔비디아 smi 드몬 -s

다음 중 하나 이상이 될 수 있습니다.

p - 전력 사용량(와트 단위) 및 온도(C 단위)

u - 사용률(SM, 메모리, 인코더 및 디코더 사용률(%))

c - Proc 및 Mem 클럭(MHz)

v - 전력 위반(%) 및 열 위반(부울 플래그로)

m - 프레임 버퍼 및 Bar1 메모리 사용량(MB)

e - ECC(집계된 단일 비트, 이중 비트 ECC 오류 수) 및 PCIe 재생
오류

t - PCIe Rx 및 Tx 처리량(MB/s)(Maxwell 이상)

4) 구성 모니터링 반복

엔비디아 smi 드몬 -c <번호 of 샘플>

지정된 샘플 수에 대한 데이터를 표시하고 종료합니다.

5) 구성 모니터링 주파수

엔비디아 smi 드몬 -d <시간 in 초>

종료될 때까지 지정된 모니터링 간격마다 데이터를 수집하고 표시합니다.
^C.

6) 디스플레이 데이터

엔비디아 smi 드몬 -o D

YYYYMMDD 형식의 날짜와 함께 모니터링 데이터를 추가합니다.

7) 디스플레이 시간

엔비디아 smi 드몬 -o T

HH:MM:SS 형식의 시간과 함께 모니터링 데이터를 추가합니다.

8) 도움말 정보

엔비디아 smi 드몬 -h

명령줄 사용에 대한 도움말 정보를 표시합니다.

악마 (실험적)
"nvidia-smi 데몬"은 연결된 하나 이상의 GPU를 모니터링하기 위해 백그라운드 프로세스를 시작합니다.
시스템에. 모니터링 주기마다 요청된 GPU를 모니터링하고 파일을 로그인합니다.
사용자가 제공한 경로 또는 /var/log/nvstats/의 기본 위치에 압축된 형식.
로그 파일은 nvstats- 형식의 시스템 날짜가 추가되어 생성됩니다.
YYYYMMDD. 로그 파일에 대한 플러시 작업은 모니터링 주기마다 수행됩니다.
데몬은 또한 /var/run/nvsmi.pid에 자체 PID를 기록합니다. 기본적으로 모니터링 데이터는
지속에는 전력 사용량, 온도, SM 클럭, 메모리 클럭 및 사용률 값이 포함됩니다.
SM, 메모리, 인코더 및 디코더용. 데몬 도구는 다음을 기록하도록 구성할 수도 있습니다.
프레임 버퍼 메모리 사용량, bar1 메모리 사용량, 전력/열
위반 및 집계 단일/이중 비트 ecc 오류. 기본 모니터링 주기가 설정됩니다.
최대 10초이며 명령줄을 통해 구성할 수 있습니다. Tesla, GRID, Quadro에서 지원됩니다.
베어메탈 64비트 Linux에서 Kepler 또는 최신 GPU용 GeForce 제품. 데몬
실행하려면 루트 권한이 필요하며 단일 인스턴스 실행만 지원합니다.
체계. 지원되는 모든 옵션은 배타적이며 어떤 순서로든 함께 사용할 수 있습니다.

용법:

1) 태만 아니 인수

엔비디아 smi 악마

백그라운드에서 실행되어 아래에서 지원되는 최대 4개의 장치에 대한 기본 메트릭을 모니터링합니다.
0초의 빈도로 자연 열거(GPU 인덱스 10부터 시작). 찍힌 날짜
로그 파일은 /var/log/nvstats/에 생성됩니다.

2) 선택 or 배우기 장치

엔비디아 smi 악마 -i <장치1,장치2, .. , 장치N>

백그라운드에서 실행하여 쉼표로 선택한 장치의 기본 메트릭을 모니터링합니다.
분리된 장치 목록. 이 도구는 아래 목록에서 지원되는 장치를 최대 4개 선택합니다.
자연 열거(GPU 인덱스 0부터 시작).

3) 선택 통계 be 모니터링

엔비디아 smi 악마 -s

다음 중 하나 이상이 될 수 있습니다.

p - 전력 사용량(와트 단위) 및 온도(C 단위)

u - 사용률(SM, 메모리, 인코더 및 디코더 사용률(%))

c - Proc 및 Mem 클럭(MHz)

v - 전력 위반(%) 및 열 위반(부울 플래그로)

m - 프레임 버퍼 및 Bar1 메모리 사용량(MB)

e - ECC(집계된 단일 비트, 이중 비트 ECC 오류 수) 및 PCIe 재생
오류

t - PCIe Rx 및 Tx 처리량(MB/s)(Maxwell 이상)

4) 구성 모니터링 주파수

엔비디아 smi 악마 -d <시간 in 초>

종료될 때까지 지정된 모니터링 간격마다 데이터를 수집합니다.

5) 구성 기록 예배 규칙서

엔비디아 smi 악마 -p <경로 of 디렉토리>

로그 파일은 지정된 디렉토리에 생성됩니다.

6) 구성 기록 파일 name

엔비디아 smi 악마 -j <문자열 추가 기록 파일 이름>

명령줄은 사용자가 제공한 문자열과 함께 로그 파일 이름을 추가하는 데 사용됩니다.

7) 끝내다 전에, 악마

엔비디아 smi 악마 -t

이 명령줄은 저장된 PID(/var/run/nvsmi.pid에 있음)를 사용하여 데몬을 종료합니다. 그것
데몬을 중지하기 위해 최선을 다하고 종료를 보장하지 않습니다. 에
데몬이 종료되지 않은 경우 사용자는 kill을 전송하여 수동으로 종료할 수 있습니다.
데몬에 신호를 보냅니다. GPU 재설정 작업(nvidia-smi를 통해)을 수행하려면 모든 GPU가 필요합니다.
데몬을 포함하여 종료될 프로세스. 데몬이 열려 있는 사용자는 다음을 볼 수 있습니다.
GPU가 사용 중이라는 효과에 대한 오류입니다.

8) 도움말 정보

엔비디아 smi 악마 -h

명령줄 사용에 대한 도움말 정보를 표시합니다.

재생 모드 (실험적)
"nvidia-smi replay" 명령줄은 로그 파일의 전체 또는 일부를 추출/재생하는 데 사용됩니다.
데몬에 의해 생성됩니다. 기본적으로 도구는 Power
사용량, 온도, SM 시계, 메모리 시계 및 SM, 메모리,
인코더 및 디코더. 재생 도구는 프레임 버퍼와 같은 다른 메트릭을 가져올 수도 있습니다.
메모리 사용량, bar1 메모리 사용량, 전력/열 위반 및 집계 단일/이중 비트
ECC 오류. 재생할 메트릭 세트를 선택하는 옵션이 있습니다.
요청된 메트릭이 유지 관리되지 않거나 지원되지 않는 것으로 기록되면 "-"로 표시됩니다.
출력. 이 모드에서 생성된 데이터 형식은 사용자가
장치 모니터링 유틸리티를 대화식으로. 명령줄에는 필수 옵션 "-f"가 필요합니다.
로그 파일 이름의 전체 경로를 지정하기 위해 지원되는 다른 모든 옵션은
배타적이며 어떤 순서로든 함께 사용할 수 있습니다.

용법:

1) 지정 기록 파일 be 재생

엔비디아 smi 재생 -f <로그 파일 이름>

압축된 로그 파일에서 모니터링 데이터를 가져오고 사용자가 한 줄을 볼 수 있도록 합니다.
저장된 각 모니터링 반복에 대한 모니터링 데이터(타임스탬프가 있는 기본 메트릭)
로그 파일에서. 모니터링 데이터의 새로운 라인은 관계없이 XNUMX초마다 재생됩니다.
수집 당시 유지된 실제 모니터링 빈도. 표시된다
파일의 끝까지 또는 ^C에 의해 종료될 때까지.

2) 필터 통계 be 재생

엔비디아 smi 재생 -f <경로 기록 파일> -s

다음 중 하나 이상이 될 수 있습니다.

p - 전력 사용량(와트 단위) 및 온도(C 단위)

u - 사용률(SM, 메모리, 인코더 및 디코더 사용률(%))

c - Proc 및 Mem 클럭(MHz)

v - 전력 위반(%) 및 열 위반(부울 플래그로)

m - 프레임 버퍼 및 Bar1 메모리 사용량(MB)

e - ECC(집계된 단일 비트, 이중 비트 ECC 오류 수) 및 PCIe 재생
오류

t - PCIe Rx 및 Tx 처리량(MB/s)(Maxwell 이상)

3) 한도 재생 or 배우기 장치

엔비디아 smi 재생 -f <로그 파일> -i <장치1,장치2, .. , 장치N>

쉼표로 구분된 장치에서 선택한 장치 집합으로 지표 보고를 제한합니다.
목록. 이 도구는 로그 파일에서 유지 관리되지 않는 모든 장치를 건너뜁니다.

4) 제한 전에, 시간 액자 사이에 어느 데이터 is 신고

엔비디아 smi 재생 -f <로그 파일> -b <시작 시간 in HH : MM : SS 형식> -e <끝 시간 in
HH : MM : SS 형식>

이 옵션을 사용하면 지정된 시간 범위 사이에서 데이터를 제한할 수 있습니다. 지정
-b 또는 -e 옵션을 사용하여 시간을 0으로 지정하면 각각 시작 또는 종료 파일을 의미합니다.

5) 리디렉션 재생 정보 a 기록 파일

엔비디아 smi 재생 -f <로그 파일> -r <출력 파일 이름>

이 옵션은 로그 파일을 입력으로 받아 기본값과 관련된 정보를 추출합니다.
지정된 출력 파일의 메트릭.

6) 도움말 정보

엔비디아 smi 재생 -h

명령줄 사용에 대한 도움말 정보를 표시합니다.

방법 모니터링
"nvidia-smi pmon" 명령줄은 컴퓨팅 및 그래픽 프로세스를 모니터링하는 데 사용됩니다.
시스템에 연결된 하나 이상의 GPU(최대 4개 장치)에서 실행됩니다. 이 도구는
사용자는 매 시간마다 각 장치에서 실행 중인 모든 프로세스에 대한 통계를 볼 수 있습니다.
모니터링 주기. 출력은 간결한 형식이며 대화식으로 해석하기 쉽습니다.
방법. 라인당 출력 데이터는 터미널 크기에 따라 제한됩니다. Tesla에서 지원되며,
베어 메탈 64에서 Kepler 또는 최신 GPU용 GRID, Quadro 및 제한된 GeForce 제품
비트 리눅스. 기본적으로 각 프로세스에 대한 모니터링 데이터에는 pid, 명령이 포함됩니다.
마지막 이후 SM, 메모리, 인코더 및 디코더의 이름 및 평균 사용 값
모니터링 주기. 또한 각 프레임 버퍼 메모리 사용량을 보고하도록 구성할 수 있습니다.
프로세스. 장치에 대해 실행 중인 프로세스가 없으면 모든 메트릭이 보고됩니다.
장치에 대해 "-"로. 기기 또는 기타 기기에서 지원되지 않는 측정항목이 있는 경우
메트릭 가져오기 오류도 출력 데이터에서 "-"로 보고됩니다. 사용자는 또한
각 실행에 대한 모니터링 빈도 및 모니터링 반복 횟수를 구성합니다. 거기
또한 각 줄에 날짜와 시간을 포함하는 옵션입니다. 지원되는 모든 옵션은
배타적이며 어떤 순서로든 함께 사용할 수 있습니다.

용법:

1) 태만 아니 인수

엔비디아 smi PMON

최대 4개의 지원되는 장치에 대해 각 장치에서 실행 중인 모든 프로세스를 모니터링합니다.
0초의 빈도로 자연 열거(GPU 인덱스 1부터 시작). 까지 실행
^C로 종료됩니다.

2) 선택 or 배우기 장치

엔비디아 smi PMON -i <장치1,장치2, .. , 장치N>

쉼표로 선택한 장치에서 실행 중인 모든 프로세스에 대한 통계를 보고합니다.
분리된 장치 목록. 이 도구는 아래 목록에서 지원되는 장치를 최대 4개 선택합니다.
자연 열거(GPU 인덱스 0부터 시작).

3) 선택 통계 be 표시된

엔비디아 smi PMON -s

다음 중 하나 이상이 될 수 있습니다.

u - 사용률(프로세스에 대한 SM, 메모리, 인코더 및 디코더 사용률(%)).
마지막 모니터링 주기 이후 평균 사용률을 보고합니다.

m - 프레임 버퍼 사용량(MB). 메모리 사용량에 대한 즉각적인 값을 보고합니다.

4) 구성 모니터링 반복

엔비디아 smi PMON -c <번호 of 샘플>

지정된 샘플 수에 대한 데이터를 표시하고 종료합니다.

5) 구성 모니터링 주파수

엔비디아 smi PMON -d <시간 in 초>

종료될 때까지 지정된 모니터링 간격마다 데이터를 수집하고 표시합니다.
^C. 모니터링 빈도는 1초에서 10초 사이여야 합니다.

6) 디스플레이 데이터

엔비디아 smi PMON -o D

YYYYMMDD 형식의 날짜와 함께 모니터링 데이터를 추가합니다.

7) 디스플레이 시간

엔비디아 smi PMON -o T

HH:MM:SS 형식의 시간과 함께 모니터링 데이터를 추가합니다.

8) 도움말 정보

엔비디아 smi PMON -h

명령줄 사용에 대한 도움말 정보를 표시합니다.

토폴로지 (실험적)
시스템의 GPU에 대한 토폴로지 정보, GPU가 서로 연결되는 방식 나열
RDMA가 가능한 적격 NIC로

다음 범례와 함께 사용 가능한 GPU 매트릭스를 표시합니다.

범례 :

X = 본인
SOC = 경로가 소켓 수준 링크를 통과함(예: QPI)
PHB = PCIe 호스트 브리지를 통과하는 경로
PXB = 여러 PCIe 내부 스위치를 통과하는 경로
PIX = PCIe 내부 스위치를 가로지르는 경로

UNIT ATTRIBUTES


다음 목록은 에서 반환된 가능한 모든 데이터를 설명합니다. -q -u 단위 쿼리 옵션.
달리 명시되지 않는 한 모든 수치 결과는 밑이 10이고 단위가 없습니다.

시간 기록
nvidia-smi가 호출된 시점의 현재 시스템 타임스탬프입니다. 형식은 "요일
월 일 HH:MM:SS 연도".

운전기사 버전
설치된 NVIDIA 디스플레이 드라이버의 버전입니다. 형식
"메이저 넘버. 마이너 넘버".

HIC 정보
시스템에 설치된 HIC(호스트 인터페이스 카드)에 대한 정보입니다.

펌웨어 버전
HIC에서 실행 중인 펌웨어 버전입니다.

첨부 단위
시스템에 연결된 장치의 수입니다.

프로덕트 성함
장치의 공식 제품 이름입니다. 영숫자 값입니다. 모든 S 클래스용
제품보기.

프로덕트 Id
장치의 제품 식별자입니다. 형식의 영숫자 값입니다.
"파트1-파트2-파트3". 모든 S급 제품에 적용됩니다.

프로덕트 일련의
단위에 대한 변경할 수 없는 전역 고유 식별자입니다. 영숫자 값입니다.
모든 S급 제품에 적용됩니다.

펌웨어 버전
장치에서 실행 중인 펌웨어 버전입니다. 형식은 "Major-Number.Minor-Number"입니다.
모든 S급 제품에 적용됩니다.

LED 주 정부
LED 표시기는 잠재적인 문제가 있는 시스템에 플래그를 지정하는 데 사용됩니다. AMBER의 LED 색상
문제를 나타냅니다. 모든 S 클래스 제품에 적용됩니다.

색상 LED 표시기의 색상입니다. "녹색" 또는 "황색" 중 하나입니다.

원인 현재 LED 색상의 이유. 원인은 다음과 같이 나열될 수 있습니다.
"알 수 없음", "호스트 시스템에서 황색으로 설정", "열 센서
오류", "팬 오류" 및 "온도가 임계 한계를 초과함".

온도
장치의 중요한 구성 요소에 대한 온도 판독값. 모든 판독 값은 C도입니다.
모든 판독값을 사용할 수 있는 것은 아닙니다. 모든 S-클래스 제품에 적용됩니다.

섭취 장치 흡입구의 공기 온도.

배출 단위 배기 지점의 공기 온도.

교육 위원회 장치 보드 전체의 공기 온도.

PSU
장치 전원 공급 장치에 대한 판독값. 모든 S 클래스 제품에 적용됩니다.

주 정부 PSU의 작동 상태입니다. 전원 공급 장치 상태는 다음 중 하나일 수 있습니다.
다음: "정상", "비정상", "고전압", "팬 고장", "방열판"
온도", "현재 한계", "UV 경보 임계값 미만의 전압",
"저전압", "I2C 원격 꺼짐 명령", "MOD_DISABLE 입력" 또는 "단락 핀
이행".

전압 PSU 전압 설정(볼트).

Current PSU 전류 소모량(암페어).

부채 정보
장치에 대한 팬 판독값. 각 팬에 대한 판독값이 제공됩니다.
많은. 모든 S 클래스 제품에 적용됩니다.

주 정부 팬 상태("NORMAL" 또는 "FAILED").

속도 정상적인 팬의 경우 팬 속도(RPM)입니다.

첨부 GPU
장치에 연결된 각 GPU에 해당하는 PCI 버스 ID 목록입니다. 버스
ID는 XNUMX진수로 "domain:bus:device.function" 형식을 갖습니다. 모든 S-클래스 제품에 적용됩니다.

노트


Linux에서 루트로 실행하면 NVIDIA 장치 파일이 nvidia-smi에 의해 수정될 수 있습니다. 봐주세요
드라이버 README 파일의 관련 섹션.

XNUMXD덴탈의 -a-g 인수는 이제 더 이상 사용되지 않습니다. -q-i, 각각. 하나,
이전 인수는 이 릴리스에서 계속 작동합니다.

사용 예


엔비디아 smi -q
모든 GPU에 대한 속성을 한 번 쿼리하고 표준 출력에 일반 텍스트로 표시합니다.

엔비디아 smi --format=csv, 헤더 없음 --query-gpu=uuid, 지속성 모드
시스템에 있는 모든 GPU의 UUID 및 지속성 모드를 쿼리합니다.

엔비디아 smi -q -d ECC, 전원 -i 0 -l 10 -f 아웃.로그
0초 주기로 GPU 10에 대한 ECC 오류 및 전력 소비 쿼리,
무기한으로 out.log 파일에 기록합니다.

"nvidia-smi -c 1 -i GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8"
UUID가 있는 GPU에 대해 컴퓨팅 모드를 "PROHIBITED"로 설정합니다.
"GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8".

엔비디아 smi -q -u -x --dtd
모든 단위에 대한 속성을 한 번 쿼리하고 DTD가 포함된 XML 형식으로 표시하여
표준 출력.

엔비디아 smi --dtd -u -f nvsmi_unit.dtd
단위 DTD를 nvsmi_unit.dtd에 씁니다.

엔비디아 smi -q -d SUPPORTED_CLOCKS
모든 GPU의 지원되는 클록을 표시합니다.

엔비디아 smi -i 0 --응용 프로그램-시계 2500,745
애플리케이션 클록을 2500MHz 메모리 및 745MHz 그래픽으로 설정합니다.

변경 LOG


=== 알려진 문제 ===

* Linux에서 GOM 변경이 보류 중인 경우 GPU 재설정을 트리거할 수 없습니다.

* Linux에서 GPU 재설정은 보류 중인 ECC 모드를 성공적으로 변경하지 못할 수 있습니다. 전체 재부팅은 다음과 같을 수 있습니다.
모드 변경을 활성화하는 데 필요합니다.

=== nvidia-smi v346 업데이트와 v352 간의 변경 사항 ===

* GPU당 선호도를 표시하기 위해 topo 지원 추가

* 주어진 레벨에 대해 인접 GPU를 표시하기 위한 topo 지원 추가

* 주어진 두 GPU 간의 경로를 표시하기 위해 topo 지원 추가

* 스크롤 형식의 프로세스 모니터링을 위한 "nvidia-smi pmon" 명령줄 추가

* 버그 제출에 사용할 암호화된 디버그 로그를 생성하는 "--debug" 옵션 추가
NVIDIA로 돌아가기

* Windows WDDM 모드에서 사용/사용 가능한 메모리 보고 수정

* 회계 통계는 실행 중인 프로세스와 종료된 프로세스를 모두 포함하도록 업데이트됩니다. 그만큼
실행 중인 프로세스의 실행 시간은 0으로 보고되고 다음과 같은 경우 실제 값으로 업데이트됩니다.
프로세스가 종료됩니다.

=== nvidia-smi v340 업데이트와 v346 간의 변경 사항 ===

* PCIe 재생 카운터 보고 추가

* nvidia-smi를 통한 그래픽 프로세스 보고 지원 추가

* PCIe 활용도 보고 추가

* 스크롤 형식의 장치 모니터링을 위한 dmon 명령줄 추가

* 백그라운드에서 실행하고 장치를 데몬으로 모니터링하는 데몬 명령줄 추가
프로세스. /var/log/nvstats/에 날짜가 지정된 로그 파일을 생성합니다.

* 데몬이 생성한 통계 파일을 재생/추출하기 위한 재생 명령줄 추가
수단

=== nvidia-smi v331 업데이트와 v340 간의 변경 사항 ===

* 온도 임계값 정보에 대한 보고가 추가되었습니다.

* 브랜드 정보 보고 기능 추가(예: Tesla, Quadro 등)

* K40d 및 K80에 대한 지원이 추가되었습니다.

* 샘플(전력, 활용도, 클록 변경)에 대한 최대, 최소 및 평균 보고 기능이 추가되었습니다.
명령줄 예: nvidia-smi -q -d power,utilization, clock

* nvidia-smi 통계 인터페이스를 추가하여 전력, 사용률,
시계 변경, xid 이벤트 및 각각에 첨부된 시간 개념이 있는 성능 상한 카운터
견본. 명령줄 예: nvidia-smi stats

* 둘 이상의 GPU에서 메트릭을 집합적으로 보고하기 위한 지원이 추가되었습니다. 쉼표와 함께 사용
"-i" 옵션으로 구분합니다. 예: nvidia-smi -i 0,1,2

* GPU 인코더 및 디코더 활용도 표시 지원 추가

* GPUDirect 통신 매트릭스를 표시하기 위해 nvidia-smi topo 인터페이스 추가
(실험적)

* 표시되는 GPU 보드 ID 및 다중 GPU 보드인지 여부에 대한 지원 추가

* XML 출력에서 ​​사용자 정의 스로틀 이유 제거

=== nvidia-smi v5.319 업데이트와 v331 간의 변경 사항 ===

* 마이너 번호 보고 기능이 추가되었습니다.

* 보고 BAR1 메모리 크기가 추가되었습니다.

* 브리지 칩 펌웨어 보고 기능이 추가되었습니다.

=== nvidia-smi v4.319 프로덕션과 v4.319 업데이트 간의 변경 사항 ===

* 권한 요구 사항을 변경하기 위해 새로운 --applications-clocks-permission 스위치 추가
애플리케이션 시계 설정 및 재설정용.

=== nvidia-smi v4.304와 v4.319 프로덕션 간의 변경 사항 ===

* 디스플레이 활성 상태에 대한 보고가 추가되었고 어떻게 표시되는지 명확히 하기 위해 문서가 업데이트되었습니다.
디스플레이 모드 및 디스플레이 활성 상태와 다름

* 다중 GPU 보드의 일관성을 위해 nvidia-smi -L은 항상 대신 UUID를 표시합니다.
일련 번호

* 기계가 읽을 수 있는 선택적 보고 기능이 추가되었습니다. 의 선택적 쿼리 옵션 섹션을 참조하십시오.
엔비디아-smi -h

* 페이지 폐기 정보에 대한 쿼리가 추가되었습니다. --help-query-retired-pages 및 -d 참조
PAGE_은퇴

* 이름이 변경된 클럭 스로틀 이유 사용자 정의 클럭을 애플리케이션 클럭 설정으로 변경

* 오류 시 반환 코드에는 각 오류 클래스에 대해 XNUMX이 아닌 고유한 값이 있습니다. 반환 참조
VALUE 섹션

* nvidia-smi -i 이제 문제가 있는 경우 정상적인 GPU에서 정보를 쿼리할 수 있습니다.
시스템의 다른 GPU

* 결함이 있는 GPU의 GPU 인쇄 PCI 버스 ID 문제를 가리키는 모든 메시지

* 새로운 플래그 --loop-ms는 초당 한 번보다 빠른 속도로 정보를 쿼리할 수 있습니다.
시스템 성능에 부정적인 영향을 미칩니다)

* 회계 절차에 대한 쿼리가 추가되었습니다. --help-query-accounted-apps 및 -d 참조
회계

* 쿼리 출력에 강제 전원 제한 추가

=== nvidia-smi v4.304 RC와 v4.304 프로덕션 간의 변경 사항 ===

* GPU 작동 모드(GOM) 보고 기능 추가

* GPU 작동 모드를 설정하는 새로운 --gom 스위치 추가

=== nvidia-smi v3.295와 v4.304 RC 간의 변경 사항 ===

* 사용자 피드백으로 인해 장황하지 않은 출력 형식이 변경되었습니다. 에서 보류 중인 정보를 제거했습니다.
테이블.

* 커널 모듈이 수신되지 않아 초기화에 실패할 경우 유용한 메시지 출력
인터럽트

* NVML 공유 라이브러리가 시스템에 없을 때 더 나은 오류 처리

* 새로운 --applications-clocks 스위치 추가

* --display 스위치에 새 필터를 추가했습니다. -d SUPPORTED_CLOCKS와 함께 실행하여 가능한 나열
GPU의 시계

* 여유 메모리 보고 시 반올림 합계 및 사용 메모리에서 계산하므로
가치가 더해지는

* 전원 관리 제한 제한 및 기본 제한에 대한 보고 기능 추가

* 새로운 --power-limit 스위치 추가

* 텍스처 메모리 ECC 오류 보고 추가

* 클럭 스로틀 이유 보고 추가

=== nvidia-smi v2.285와 v3.295 간의 변경 사항 ===

* 실행 명령에 대한 보다 명확한 오류 보고(예: 컴퓨팅 모드 변경)

* 한 번에 여러 GPU에서 명령을 실행할 때 해당 없음 오류는 경고로 처리됩니다.

* nvidia-smi -i는 이제 UUID도 지원합니다.

* UUID 형식이 UUID 표준과 일치하도록 변경되었으며 다른 값을 보고합니다.

=== nvidia-smi v2.0와 v2.285 간의 변경 사항 ===

* VBIOS 버전을 보고합니다.

* 데이터의 일부를 필터링하기 위해 -d/--display 플래그 추가

* PCI 하위 시스템 ID 보고 기능 추가

* M2075 및 C2075를 지원함을 나타내는 업데이트된 문서

* -u 스위치를 사용하여 HIC HWBC 펌웨어 버전 보고

* 현재 클럭 옆에 최대(P0) 클럭 보고

* 장치 또는 장치 DTD를 인쇄하는 --dtd 플래그 추가

* NVIDIA 드라이버가 실행되지 않을 때 메시지 추가

* PCIe 링크 생성(최대 및 현재) 및 링크 너비(최대 및
현재의).

* 보류 중인 드라이버 모델 가져오기는 비관리자에서 작동합니다.

* Windows 게스트 계정에서 nvidia-smi 실행 지원 추가

* -q 명령 없이 nvidia-smi를 실행하면 -q 대신 장황하지 않은 버전이 출력됩니다.
도움

* -l/--loop= 인수의 파싱 수정(기본값, 0, 큰 값)

* pciBusId 형식 변경(XXXX:XX:XX.X로 - 이 변경 사항은 280에서 볼 수 있음)

* -i 명령에 대한 busId의 구문 분석이 덜 제한적입니다. 0:2:0.0 또는
0000:02:00 및 기타 변형

* "드라이버 버전"도 포함하도록 버전 관리 체계 변경

* XML 형식은 오류 조건이 발생하더라도 항상 DTD를 따릅니다.

* 단일 및 이중 비트 ECC 이벤트 및 XID 오류에 대한 지원 추가(기본적으로 활성화됨
-x 플래그에 대해 -l 플래그가 비활성화됨)

* 장치 재설정 -r --gpu-reset 플래그 추가

* 컴퓨팅 실행 프로세스 목록 추가

* 전원 상태를 성능 상태로 변경했습니다. XML 출력에 더 이상 사용되지 않는 지원이 있습니다.
로 작성되어야 합니다.

* 업데이트된 XML 출력과 일치하도록 DTD 버전 번호를 2.0으로 업데이트했습니다.

onworks.net 서비스를 사용하여 온라인에서 alt-nvidia-361-smi 사용



최신 Linux 및 Windows 온라인 프로그램