이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 공급자에서 실행할 수 있는 alt-nvidia-304-updates-smi 명령입니다.
프로그램:
이름
nvidia-smi - NVIDIA 시스템 관리 인터페이스 프로그램
개요
nvidia-smi [옵션1 [ARG1]] [옵션2 [ARG2]] ...
기술
NVSMI는 NVIDIA의 각 Tesla 장치 및 각 장치에 대한 모니터링 정보를 제공합니다.
고급 Fermi 기반 및 Kepler 기반 Quadro 장치. 매우 제한적으로 제공합니다.
다른 유형의 NVIDIA 장치에 대한 정보. NVML 설명서를 참조하십시오.
http://developer.nvidia.com/nvidia-management-library-nvml 지원되는 기능
특정 장치에서. 데이터는 다음을 통해 일반 텍스트 또는 XML 형식으로 표시됩니다.
stdout 또는 파일. NVSMI는 또한 장치 변경을 위한 여러 관리 작업을 제공합니다.
(주).
NVSMI의 기능은 NVML C 기반 라이브러리를 통해 노출됩니다. 참조
NVML에 대한 자세한 내용은 NVIDIA 개발자 웹사이트를 참조하십시오. Python 및 Perl 래퍼
NVML도 사용할 수 있습니다. NVSMI의 출력은 역방향임을 보장하지 않습니다.
호환 가능; NVML과 바인딩은 이전 버전과 호환됩니다.
http://developer.nvidia.com/nvidia-management-library-nvml/
http://pypi.python.org/pypi/nvidia-ml-py/
http://search.cpan.org/search?쿼리=nvidia%3A%3Aml
옵션
일반 옵션
-시간, --도움
사용 정보를 인쇄하고 종료합니다.
개요 옵션
-엘, --리스트-GPUS
일련 번호 또는 UUID와 함께 시스템의 각 NVIDIA GPU를 나열합니다.
Fermi 및 Kepler 제품군의 Tesla 및 Quadro GPU는 다음과 일치하는 일련 번호를 보고합니다.
ID는 각 보드에 물리적으로 인쇄됩니다. GT200 Tesla 제품은 UUID만 지원합니다.
또한 고유하지만 보드의 식별자와 일치하지 않습니다. 기타 모든 제품
N/A를 보고합니다.
질문 옵션
-NS, --질문
GPU 또는 장치 정보를 표시합니다. 표시된 정보에는 (GPU ATTRIBUTES)
또는 (UNIT ATTRIBUTES) 이 문서의 섹션. 일부 장치 및/또는 환경에서는
가능한 모든 정보를 지원합니다. 지원되지 않는 데이터는 "해당 없음"으로 표시됩니다.
산출. 기본적으로 사용 가능한 모든 GPU 또는 장치에 대한 정보가 표시됩니다. 사용 -i
단일 GPU 또는 장치로 출력을 제한하는 옵션입니다.
[을 더한 선택 과목]
-유, --단위
GPU 데이터 대신 단위 데이터를 표시합니다. 단위 데이터는 NVIDIA S-class에만 사용할 수 있습니다.
테슬라 인클로저.
-NS, --id=아이디
지정된 단일 GPU 또는 단위에 대한 데이터를 표시합니다. 지정된 ID는 GPU/장치의
드라이버가 반환하는 자연 열거형의 0부터 시작하는 인덱스, GPU의 보드 직렬
번호, GPU의 UUID 또는 GPU의 PCI 버스 ID(XNUMX진수로 domain:bus:device.function).
일관성을 원하는 사용자는 UUID 또는 PCI 버스 ID를 사용하는 것이 좋습니다.
장치 열거 순서는 재부팅과 보드 간에 일관성이 보장되지 않습니다.
일련 번호는 동일한 보드의 여러 GPU 간에 공유될 수 있습니다.
-f 파일, --파일명=파일
기본 stdout 대신 지정된 파일로 쿼리 출력을 리디렉션합니다. 지정된
파일을 덮어씁니다.
-NS, --xml 형식
사람이 읽을 수 있는 기본 형식 대신 XML 출력을 생성합니다. GPU 및 단위 쿼리 모두
출력은 해당 DTD를 따릅니다. 다음을 통해 사용할 수 있습니다. --dtd 깃발.
--dtd
와 함께 사용 -x. XML 출력에 DTD를 포함합니다.
-NS, --표시하다
선택한 정보만 표시: MEMORY, UTILIZATION, ECC, TEMPERATURE, POWER, CLOCK,
컴퓨팅, PID, 성능. 플래그는 "MEMORY,ECC"와 같이 쉼표와 결합할 수 있습니다. 하지 않는다
-u/--unit 또는 -x/--xml-format 플래그와 함께 작동합니다.
-l 비서, --루프=SEC
단순히 기본값이 아닌 지정된 간격으로 쿼리 데이터를 지속적으로 보고합니다.
한 번. 애플리케이션은 쿼리 사이에 잠자기 상태가 됩니다. Linux ECC 오류 또는 XID의 경우
오류 이벤트는 다음과 같은 경우 절전 기간 동안 인쇄됩니다. -x 플래그가 지정되지 않았습니다.
언제든지 Ctrl+C를 누르면 루프가 중단되고, 그렇지 않으면 무한정 실행됩니다.
인수가 지정되지 않은 경우 -l 기본 간격인 5초가 사용됩니다.
장치 변경 옵션
[어느 한 NS]
-오후, --지속성 모드=모드
대상 GPU에 대한 지속성 모드를 설정합니다. (GPU ATTRIBUTES) 섹션
지속 모드에 대한 설명입니다. 루트가 필요합니다. 단일 GPU가 아닌 경우 모든 GPU에 영향을 미칩니다.
를 사용하여 지정됩니다. -i 논쟁. 이 작업의 효과는 즉각적입니다. 하지만,
재부팅해도 지속되지 않습니다. 각 재부팅 후 지속 모드는 기본적으로
"장애가있는". Linux에서만 사용할 수 있습니다.
-이자형, --ecc-config=구성
대상 GPU에 대한 ECC 모드를 설정합니다. (GPU ATTRIBUTES) 설명 섹션
ECC 모드의. 루트가 필요합니다. 단일 GPU가 다음을 사용하여 지정되지 않는 한 모든 GPU에 영향을 미칩니다.
전에, -i 논쟁. 이 설정은 다음 재부팅 후에 적용되며 영구적입니다.
-NS, --reset-ecc-errors=유형
대상 GPU에 대한 ECC 오류 카운터를 재설정합니다. (GPU ATTRIBUTES) 섹션
ECC 오류 카운터 유형에 대한 설명. 사용 가능한 인수는 0|VOLATILE 또는
1|집계. 루트가 필요합니다. 단일 GPU가 다음을 사용하여 지정되지 않는 한 모든 GPU에 영향을 미칩니다.
전에, -i 논쟁. 이 작업의 효과는 즉각적입니다.
-씨, --컴퓨팅 모드=모드
대상 GPU의 컴퓨팅 모드를 설정합니다. (GPU ATTRIBUTES) 섹션
컴퓨팅 모드에 대한 설명입니다. 루트가 필요합니다. 단일 GPU가 아닌 한 모든 GPU에 영향을 미칩니다.
를 사용하여 지정 -i 논쟁. 이 작업의 효과는 즉각적입니다. 그러나, 그것은
재부팅 후에도 지속되지 않습니다. 재부팅할 때마다 컴퓨팅 모드가 "DEFAULT"로 재설정됩니다.
-DM, --드라이버 모델
-fdm, --force-드라이버-모델
TCC 드라이버 모델을 활성화하거나 비활성화합니다. Windows 전용. 관리자 권한이 필요합니다.
-DM 디스플레이가 부착되면 실패하지만 -fdm 드라이버 모델을 강제로 변경합니다.
단일 GPU가 다음을 사용하여 지정되지 않는 한 모든 GPU에 영향을 미칩니다. -i 논쟁. 재부팅은
변경이 발생하는 데 필요합니다. 보다 운전기사 모델 Windows에 대한 자세한 내용은
드라이버 모델.
--곰
GPU 작동 모드 설정: 0/ALL_ON, 1/COMPUTE, 2/LOW_DP GK110 M-class 및 X-에서 지원됨
클래스 Tesla &tm; 케플러 제품군의 제품. Quadro ® 및 Tesla에서는 지원되지 않음
&tm; C급 제품. 관리자 권한이 필요합니다. 보다 GPU 조작 모드 을 통한
GOM에 대한 추가 정보. GOM 변경 사항은 재부팅 후 적용됩니다. 재부팅 요구 사항
향후 제거될 수 있습니다. 컴퓨팅 전용 GOM은 WDDM(Windows 디스플레이
드라이버 모델)
-NS, --gpu 리셋
GPU의 보조 버스 재설정을 트리거합니다. 상황에서 GPU HW 상태를 재설정하는 데 사용할 수 있습니다.
그렇지 않으면 시스템 재부팅이 필요합니다. 일반적으로 더블 비트 ECC 오류가 있는 경우 유용합니다.
발생했습니다. 필요 -i 대상 특정 장치로 전환합니다. 루트가 필요합니다. 할 수 없다
이 특정 장치를 사용하는 모든 응용 프로그램(예: CUDA 응용 프로그램, 그래픽
X 서버와 같은 애플리케이션, nvidia-smi의 다른 인스턴스와 같은 모니터링 애플리케이션).
또한 시스템의 다른 GPU에서 실행되는 컴퓨팅 응용 프로그램이 있을 수 없습니다. 오직
Linux에서 실행되는 Fermi 및 Kepler 제품군의 지원되는 장치에서.
GPU 재설정은 모든 경우에 작동하지 않을 수 있습니다. 일부 상황에서는 HW가 있을 수 있습니다.
재설정 후 초기 상태로 되돌리지 못하는 보드의 구성 요소
요구. 이것은 Fermi-generation 제품 대 Kepler 등에서 볼 가능성이 더 큽니다.
정지된 GPU에서 재설정이 수행되는 경우 나타날 수 있습니다.
재설정 후에는 GPU 상태를 더 이상 확인하기 전에 확인하는 것이 좋습니다.
사용하다. nvidia-healthmon 도구는 이 테스트에 적합합니다. GPU가 건강하지 않은 경우
노드의 전원을 껐다 켜서 완전한 재설정을 시작해야 합니다. 엔비디아 헬스몬은
TDK의 일부로 배포됨 http://developer.nvidia.com/tesla-deployment-kit
-악, --applications-clocks=MEM_CLOCK,GRAPHICS_CLOCK
최대값 지정 GPU를 정의하는 쌍으로 클럭(예: 2000,800)
GPU에서 애플리케이션을 실행하는 동안 속도. Kepler 제품군에서 지원되는 기기에서만 가능합니다.
루트가 필요합니다.
-랙, --재설정-응용 프로그램-시계
애플리케이션 시계를 기본값으로 재설정합니다. Kepler에서 지원하는 기기에서만
가족. 루트가 필요합니다.
-pl, --전력 제한=POWER_LIMIT
최대 전력 제한을 와트로 지정합니다. 정수 및 부동 소수점 숫자를 허용합니다. 오직
Kepler 제품군에서 지원되는 장치에서. 관리자 권한이 필요합니다. 가치 요구
nvidia-smi에서 보고한 Min과 Max Power Limit 사이에 있어야 합니다.
[을 더한 선택 과목]
-NS, --id=아이디
지정된 단일 GPU를 수정합니다. 지정된 id는 GPU/Unit의 0 기반 인덱스일 수 있습니다.
드라이버가 반환한 자연 열거, GPU의 보드 일련 번호, GPU의
UUID 또는 GPU의 PCI 버스 ID(XNUMX진수로 domain:bus:device.function). 그것을 추천합니다
일관성을 원하는 사용자는 UUID 또는 PCI 버스 ID를 사용합니다.
재부팅 사이에 순서가 일관성이 있다고 보장되지 않으며 보드 일련 번호가
동일한 보드의 여러 GPU 간에 공유할 수 있습니다.
UNIT 변경 옵션
-NS, --toggle-led=상태
기기 전면과 후면의 LED 표시등 상태를 지정된 색상으로 설정합니다. 보다
(UNIT ATTRIBUTES) LED 상태에 대한 설명은 섹션을 참조하십시오. 허용되는 색상은
0|녹색 및 1|황색. 루트가 필요합니다.
[을 더한 선택 과목]
-NS, --id=아이디
지정된 단일 단위를 수정합니다. 지정된 id는 단위의 0부터 시작하는 인덱스입니다.
드라이버가 반환한 자연 열거입니다.
표시 DTD 옵션
--dtd
디스플레이 장치 또는 단위 DTD.
[을 더한 선택 과목]
-f 파일, --파일명=파일
기본 stdout 대신 지정된 파일로 쿼리 출력을 리디렉션합니다. 지정된
파일을 덮어씁니다.
-유, --단위
장치 DTD 대신 디스플레이 단위 DTD.
GPU ATTRIBUTES
다음 목록은 에서 반환된 가능한 모든 데이터를 설명합니다. -q 장치 쿼리 옵션.
달리 명시되지 않는 한 모든 수치 결과는 밑이 10이고 단위가 없습니다.
시간 기록
nvidia-smi가 호출된 시점의 현재 시스템 타임스탬프입니다. 형식은 "요일
월 일 HH:MM:SS 연도".
운전기사 버전
설치된 NVIDIA 디스플레이 드라이버의 버전입니다. 이것은 영숫자 문자열입니다.
첨부 GPU
액세스 가능한 NVIDIA GPU의 수입니다. Linux에서 모든 NVIDIA GPU는
접근성.
프로덕트 성함
GPU의 공식 제품 이름입니다. 이것은 영숫자 문자열입니다. 모든 제품.
디스플레이 모드
디스플레이가 GPU에 연결되어 있는지 여부를 나타내는 플래그입니다. "활성화됨"은
부착된 디스플레이. "비활성화됨"은 그렇지 않은 경우를 나타냅니다.
고집 모드
GPU에 대해 지속성 모드가 활성화되었는지 여부를 나타내는 플래그입니다. 값은 다음 중 하나입니다.
"활성화됨" 또는 "비활성화됨". 지속성 모드가 활성화되면 NVIDIA 드라이버가 유지됩니다.
X11 또는 nvidia-smi와 같은 활성 클라이언트가 없는 경우에도 로드됩니다. 이것은 최소화
CUDA 프로그램과 같은 종속 앱 실행과 관련된 드라이버 로드 대기 시간. 을위한
모든 CUDA 지원 제품. 리눅스 전용.
운전기사 모델
Windows에서는 TCC 및 WDDM 드라이버 모델이 지원됩니다. 드라이버 모델 변경 가능
이랑 (-DM) 또는 (-fdm) 플래그. TCC 드라이버 모델은 컴퓨팅에 최적화되어 있습니다.
응용 프로그램. TCC를 사용하면 IE 커널 실행 시간이 더 빨라집니다. WDDM 드라이버 모델
그래픽 응용 프로그램용으로 설계되었으며 컴퓨팅 응용 프로그램에는 권장되지 않습니다.
Linux는 여러 드라이버 모델을 지원하지 않으며 항상 "N/A" 값을 갖습니다.
Current 현재 사용 중인 드라이버 모델입니다. Linux에서는 항상 "해당 사항 없음"입니다.
대기중 다음에 재부팅할 때 사용할 드라이버 모델입니다. 항상 "해당 사항 없음" 켜짐
리눅스.
일련의 번호
이 번호는 각 보드에 물리적으로 인쇄된 일련 번호와 일치합니다. 이는 전 세계적으로
고유한 변경할 수 없는 영숫자 값입니다.
GPU UUID
이 값은 GPU의 전역적으로 고유한 변경할 수 없는 영숫자 식별자입니다. 그렇습니다
보드의 물리적 레이블과 일치하지 않습니다.
VBIOS 버전
GPU 보드의 BIOS.
정보 버전
GPU 보드의 정보 저장소에 있는 각 개체의 버전 번호입니다. 정보는
GPU에 대한 구성 및 상태 데이터의 작고 영구적인 저장소입니다. 모든 정보 버전
필드는 숫자입니다. 일부 GPU가 있기 때문에 이러한 버전 번호를 아는 것이 유용할 수 있습니다.
기능은 특정 버전 이상의 정보에서만 사용할 수 있습니다.
아래 필드 중 하나라도 알 수 없는 오류를 반환하는 경우 추가 정보 확인 확인은
수행되고 적절한 경고 메시지가 표시됩니다.
영상 버전 OEM 구성 데이터의 버전입니다. infoROM의 글로벌 버전
영상. VBIOS 버전과 같은 이미지 버전은 정확한 정보를 고유하게 설명합니다.
infoROM 개체와 대조적으로 보드에서 깜박이는 infoROM 버전
지원되는 기능의 지표일 뿐입니다.
OEM 목적 OEM 구성 데이터의 버전입니다.
ECC 목적 ECC 기록 데이터의 버전입니다.
출력 목적 전원 관리 데이터의 버전입니다.
GPU 조작 모드
GOM을 사용하면 GPU 기능을 비활성화하여 전력 사용량을 줄이고 GPU 처리량을 최적화할 수 있습니다.
각 GOM은 특정 사용자 요구를 충족하도록 설계되었습니다.
ALL_ON 모드에서는 모든 것이 활성화되고 최고 속도로 실행됩니다.
COMPUTE 모드는 컴퓨팅 작업만 실행하도록 설계되었습니다. 그래픽 작업은
수있었습니다.
LOW_DP 모드는 높은 성능을 요구하지 않는 그래픽 응용 프로그램을 실행하도록 설계되었습니다.
대역폭 배정밀도.
GOM은 (--곰) 깃발.
GK110 M-class 및 X-class Tesla &tm; 케플러 제품군의 제품. 아니다
Quadro ® 및 Tesla &tm; C급 제품.
Current 현재 사용 중인 GOM입니다.
대기중 다음에 재부팅할 때 사용할 GOM입니다.
PCI
장치에 대한 기본 PCI 정보입니다. 이 정보 중 일부는 카드가
시스템에서 추가/제거/이동. 모든 제품.
버스 PCI 버스 번호(XNUMX진수)
장치 PCI 장치 번호(XNUMX진수)
도메인 PCI 도메인 번호(XNUMX진수)
장치 Id PCI 공급업체 장치 ID(XNUMX진수)
서브 시스템 Id PCI 하위 시스템 ID(XNUMX진수)
버스 Id PCI 버스 ID는 "도메인:버스:장치.기능"으로, XNUMX진수로 표시됩니다.
GPU (링크) 정보
PCIe 링크 생성 및 버스 폭
Current 현재 링크 생성 및 너비입니다. GPU가
사용중이 아닙니다.
최고 이 GPU 및 시스템에서 가능한 최대 링크 생성 및 너비
구성. 예를 들어 GPU가 더 높은 PCIe 세대를 지원하는 경우
시스템이 지원하는 것보다 많으면 시스템 PCIe 생성이 보고됩니다.
부채 속도
팬 속도 값은 현재 장치의 팬이 작동하는 최대 속도의 백분율입니다.
에서 실행할 예정입니다. 범위는 0~100%입니다. 참고: 보고된 속도는 의도한 것입니다.
팬 속도. 팬이 물리적으로 차단되어 회전할 수 없는 경우 이 출력은
실제 팬 속도와 일치합니다. 많은 부품이 팬 속도에 의존하기 때문에 보고하지 않습니다.
주변 인클로저의 팬을 통한 냉각. 전용 기능이 있는 모든 개별 제품용
팬.
성능 주 정부
GPU의 현재 성능 상태입니다. 상태 범위는 P0(최대 성능)에서
P12(최소 성능).
시계 조절판 이유
클록의 빈도를 줄이는 요인에 대한 정보를 검색합니다. 에만
Kepler 제품군에서 지원되는 Tesla 장치.
모든 스로틀 이유가 "비활성"으로 반환되면 시계가 다음과 같이 실행되고 있음을 의미합니다.
가능한 높은.
유휴 GPU에서 실행 중인 것이 없고 클록이 유휴 상태로 떨어지고 있습니다.
이 제한기는 이후 릴리스에서 제거될 수 있습니다.
사용자 한정된 시계
GPU 클럭은 사용자 지정 제한으로 제한됩니다. 예: nvidia-smi에서 설정
--응용 프로그램-시계=
SW 출력 캡 SW Power Scaling 알고리즘은 요청된 클럭 아래로 클럭을 줄입니다.
GPU가 너무 많은 전력을 소비하기 때문입니다. 예: SW 전력 캡 한도는
nvidia-smi --power-limit=로 변경
HW 천천히 해 HW Slowdown(코어 클럭을 2배 이상 감소)이 작동 중입니다.
이것은 다음을 나타내는 지표입니다.
* 온도가 너무 높음
* 외부 전원 브레이크 설정이 트리거됩니다(예: 시스템 전원에 의해
공급)
* 전력 소모가 너무 높고 Fast Trigger 보호로 인해 클럭이 감소합니다.
* PState 또는 시계 변경 중에도 보고될 수 있음
** 이 동작은 이후 릴리스에서 제거될 수 있습니다.
알 수 없는 다른 불특정 요인은 시계를 줄이는 것입니다.
메모리 용법
온보드 메모리 정보. 보고된 총 메모리는 ECC 상태의 영향을 받습니다. ECC인 경우
사용 가능한 총 메모리는 필수 요건으로 인해 몇 퍼센트 감소합니다
패리티 비트. 드라이버는 내부 사용을 위해 소량의 메모리를 예약할 수도 있습니다.
GPU에 대한 적극적인 작업 없이. 모든 제품.
금액 설치된 총 GPU 메모리입니다.
사용 된 활성 컨텍스트에 의해 할당된 총 메모리입니다.
무료 총 여유 메모리.
Compute 모드
컴퓨팅 모드 플래그는 개별 또는 여러 컴퓨팅 애플리케이션이
GPU에서 실행합니다.
"DEFAULT"는 장치당 여러 컨텍스트가 허용됨을 의미합니다.
"EXCLUSIVE_THREAD"는 장치당 하나의 컨텍스트만 허용되며 다음 위치에서 한 스레드에서 사용할 수 있음을 의미합니다.
시간.
"EXCLUSIVE_PROCESS"는 여러 장치에서 사용할 수 있는 장치당 하나의 컨텍스트만 허용됨을 의미합니다.
한 번에 스레드.
"PROHIBITED"는 장치당 허용되는 컨텍스트가 없음을 의미합니다(컴퓨팅 앱 없음).
"EXCLUSIVE_PROCESS"가 CUDA 4.0에 추가되었습니다. 이전 CUDA 릴리스는 하나만 지원했습니다.
CUDA 4.0 이상에서 "EXCLUSIVE_THREAD"에 해당하는 단독 모드입니다.
모든 CUDA 지원 제품용.
이용
활용률은 각 GPU가 시간이 지남에 따라 얼마나 바쁜지를 보고하고 어떻게
많은 응용 프로그램이 시스템의 GPU를 사용하고 있습니다.
GPU 지난 XNUMX초 동안 하나 이상의 커널이 실행된 시간의 백분율
GPU에서 실행.
메모리 지난 XNUMX초 동안 전역(장치) 메모리가 사용된 시간의 백분율
읽거나 쓰고 있었습니다.
Ecc 모드
ECC 지원이 활성화되었는지 여부를 나타내는 플래그입니다. "활성화" 또는
"장애가있는". ECC 모드로 변경하려면 재부팅해야 합니다. Inforom ECC 개체 버전 필요
1.0 이상.
Current GPU가 현재 작동 중인 ECC 모드입니다.
대기중 다음 재부팅 후 GPU가 작동할 ECC 모드입니다.
ECC 오류
NVIDIA GPU는 다양한 유형의 ECC 오류에 대한 오류 수를 제공할 수 있습니다. 일부 ECC 오류는
단일 비트 또는 이중 비트(단일 비트 오류가 수정되고 이중 비트 오류가 수정됨)
수정할 수 없습니다. 텍스처 메모리 오류는 재전송을 통해 수정 가능하거나 수정 불가능할 수 있습니다.
재전송이 실패하는 경우. 이러한 오류는 두 가지 시간 척도(휘발성 및
골재). 단일 비트 ECC 오류는 HW에 의해 자동으로 수정되며 결과가 발생하지 않습니다.
데이터 손상. 더블 비트 오류가 감지되었지만 수정되지 않았습니다. ECC를 참조하십시오
더블 비트일 때 컴퓨팅 애플리케이션 동작에 대한 정보는 웹 문서
오류가 발생합니다. 휘발성 오류 카운터는 마지막 이후 감지된 오류 수를 추적합니다.
드라이버 로드. 집계 오류 수는 무기한 지속되므로 수명으로 작동합니다.
카운터.
휘발성 수에 대한 참고 사항: Windows에서는 부팅당 한 번입니다. Linux에서는 더 많을 수 있습니다.
잦은. Linux에서 활성 클라이언트가 없을 때 드라이버가 언로드됩니다. 따라서 만약
지속성 모드가 활성화되어 있거나 항상 활성 상태인 드라이버 클라이언트(예: X11)가 있는 경우
Linux는 또한 부팅별 동작을 봅니다. 그렇지 않은 경우 휘발성 카운트는 계산할 때마다 재설정됩니다.
앱이 실행됩니다.
Fermi 및 Kepler 제품군의 Tesla 및 Quadro 제품은 총 ECC 오류를 표시할 수 있습니다.
카운트뿐만 아니라 칩의 위치를 기반으로 한 오류 분석. 위치는
아래에서 묘사 되어진. 집계 오류 수에 대한 위치 기반 데이터에는 Inforom ECC가 필요합니다.
개체 버전 2.0. 다른 모든 ECC 카운트에는 ECC 개체 버전 1.0이 필요합니다.
장치 메모리 전역 장치 메모리에서 오류가 감지되었습니다.
회원가입 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에 레지스터 파일 메모리에서 오류가 감지되었습니다.
L1 캐시 L1 캐시에서 오류가 감지되었습니다.
L2 캐시 L2 캐시에서 오류가 감지되었습니다.
조직 메모리 텍스처 메모리에서 패리티 오류가 감지되었습니다.
금액 전체 칩에서 감지된 총 오류입니다. 의 합 장치 메모리, 회원가입
입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에, L1 캐시, L2 캐시 그리고 조직 메모리.
온도
보드에 있는 온도 센서의 판독값. 모든 판독값은 C도입니다. 전부는 아닙니다.
제품은 모든 읽기 유형을 지원합니다. 특히 모듈 형태의 제품은
케이스 팬에 의존하거나 수동 냉각은 일반적으로 온도 판독값을 제공하지 않습니다. 보다
아래에 제한 사항이 있습니다.
GPU 코어 GPU 온도. 모든 디스크리트 및 S-클래스 제품용.
출력 판독
전력 판독값은 GPU의 현재 전력 사용량과 요인을 밝히는 데 도움이 됩니다.
그 사용법에 영향을 미칩니다. 전원 관리가 활성화되면 GPU는 전력 소모를 제한합니다.
현재 성능을 조작하여 미리 정의된 전력 엔벨로프에 맞게 부하
상태. 가용성 제한은 아래를 참조하십시오.
출력 주 정부 전원 상태는 더 이상 사용되지 않으며 에서 성능 상태로 이름이 변경되었습니다.
2.285. XML 호환성을 유지하기 위해 XML 형식의 성능 상태는
두 곳에 모두 기재되어 있습니다.
출력
전원 관리가 활성화되었는지 여부를 나타내는 플래그입니다. 어느 하나
"지원됨" 또는 "해당 사항 없음". Inforom PWR 개체 버전 3.0 이상이 필요합니다.
케플러 장치.
출력 그리기 전체 보드에 대해 마지막으로 측정된 전력 소비량(와트)입니다. 오직
전원 관리가 지원되는 경우 사용할 수 있습니다. 이 판독값은 다음과 같이 정확합니다.
+/- 5와트 이내. Inforom PWR 개체 버전 3.0 이상이 필요합니다.
케플러 장치.
출력 한도 전력 관리 알고리즘의 전력 한도(와트)입니다. 총 보드
전력 소비는 전력 관리 알고리즘에 의해 조작됩니다.
이 값 아래에 유지됩니다. 전원 관리가 지원되는 경우에만 사용할 수 있습니다.
Inforom PWR 개체 버전 3.0 이상 또는 Kepler 장치가 필요합니다. 에
Kepler 장치의 전력 제한은 -pl,--power-limit=를 사용하여 조정할 수 있습니다.
스위치.
태만 출력 한도
기본 전원 관리 알고리즘의 전원 한도(와트)입니다. 힘
제한은 드라이버 언로드 후 기본 전력 제한으로 다시 설정됩니다. 에만
Kepler 제품군에서 지원되는 장치.
Min 출력 한도
전력 제한을 설정할 수 있는 최소값(와트)입니다. 에만
Kepler 제품군에서 지원되는 장치.
Max 출력 한도
전력 제한을 설정할 수 있는 최대값(와트)입니다. 에만
Kepler 제품군에서 지원되는 장치.
시계
GPU의 일부가 실행되고 있는 현재 주파수입니다. 모든 판독값은 MHz 단위입니다.
그래픽 업로드 그래픽(셰이더) 클럭의 현재 주파수입니다.
SM SM(Streaming Multiprocessor) 클럭의 현재 주파수입니다.
메모리 메모리 클럭의 현재 주파수.
어플리케이션 시계
응용 프로그램이 실행될 사용자 지정 빈도입니다. 로 변경할 수 있습니다.
[-ac | --applications-clocks] 스위치.
그래픽 업로드 그래픽(셰이더) 클럭의 사용자 지정 주파수입니다.
메모리 메모리 클럭의 사용자 지정 주파수.
태만 어플리케이션 시계
애플리케이션 시계의 기본값입니다. 이것은 사용될 애플리케이션 시계입니다.
시스템 재부팅 또는 드라이버 다시 로드 후.
그래픽 업로드 그래픽(셰이더)의 응용 프로그램 시계의 기본값입니다.
메모리 메모리 클럭의 애플리케이션 클럭의 기본값입니다.
Max 시계
GPU의 일부가 실행되도록 설계된 최대 주파수입니다. 모든 판독값은 MHz 단위입니다.
그래픽 업로드 그래픽(셰이더) 클럭의 최대 주파수.
SM SM(Streaming Multiprocessor) 클럭의 최대 주파수.
메모리 메모리 클럭의 최대 주파수.
지원 시계
GPU가 작동할 수 있는 가능한 메모리 및 그래픽 클록 조합 목록(
HW 브레이크 감소 클록 고려). 다음은 유일한 시계 조합입니다.
--applications-clocks 플래그에 전달할 수 있습니다. 지원되는 시계는 -q -d일 때만 나열됩니다.
SUPPORTED_CLOCKS 스위치가 제공되거나 XML 형식으로 제공됩니다.
Compute 프로세스
장치에 컴퓨팅 컨텍스트가 있는 프로세스 목록입니다.
각 항목의 형식은 " . "
사용 된 GPU 메모리
컨텍스트에 의해 장치에서 사용된 메모리 양입니다. Windows에서 사용할 수 없음
Windows KMD가 관리하지 않는 모든 메모리를 관리하기 때문에 WDDM 모드에서 실행할 때
엔비디아 드라이버.
UNIT ATTRIBUTES
다음 목록은 에서 반환된 가능한 모든 데이터를 설명합니다. -q -u 단위 쿼리 옵션.
달리 명시되지 않는 한 모든 수치 결과는 밑이 10이고 단위가 없습니다.
시간 기록
nvidia-smi가 호출된 시점의 현재 시스템 타임스탬프입니다. 형식은 "요일
월 일 HH:MM:SS 연도".
운전기사 버전
설치된 NVIDIA 디스플레이 드라이버의 버전입니다. 형식
"메이저 넘버. 마이너 넘버".
HIC 정보
시스템에 설치된 HIC(호스트 인터페이스 카드)에 대한 정보입니다.
펌웨어 버전
HIC에서 실행 중인 펌웨어 버전입니다.
첨부 단위
시스템에 연결된 장치의 수입니다.
프로덕트 성함
장치의 공식 제품 이름입니다. 영숫자 값입니다. 모든 S 클래스용
제품보기.
프로덕트 Id
장치의 제품 식별자입니다. 형식의 영숫자 값입니다.
"파트1-파트2-파트3". 모든 S급 제품에 적용됩니다.
프로덕트 일련의
단위에 대한 변경할 수 없는 전역 고유 식별자입니다. 영숫자 값입니다.
모든 S급 제품에 적용됩니다.
펌웨어 버전
장치에서 실행 중인 펌웨어 버전입니다. 형식은 "Major-Number.Minor-Number"입니다.
모든 S급 제품에 적용됩니다.
LED 주 정부
LED 표시기는 잠재적인 문제가 있는 시스템에 플래그를 지정하는 데 사용됩니다. AMBER의 LED 색상
문제를 나타냅니다. 모든 S 클래스 제품에 적용됩니다.
색상 LED 표시기의 색상입니다. "녹색" 또는 "황색" 중 하나입니다.
원인 현재 LED 색상의 이유. 원인은 다음과 같이 나열될 수 있습니다.
"알 수 없음", "호스트 시스템에서 황색으로 설정", "열 센서
오류", "팬 오류" 및 "온도가 임계 한계를 초과함".
온도
장치의 중요한 구성 요소에 대한 온도 판독값. 모든 판독 값은 C도입니다.
모든 판독값을 사용할 수 있는 것은 아닙니다. 모든 S-클래스 제품에 적용됩니다.
섭취 장치 흡입구의 공기 온도.
배출 단위 배기 지점의 공기 온도.
교육 위원회 장치 보드 전체의 공기 온도.
PSU
장치 전원 공급 장치에 대한 판독값. 모든 S 클래스 제품에 적용됩니다.
주 정부 PSU의 작동 상태입니다. 전원 공급 장치 상태는 다음 중 하나일 수 있습니다.
다음: "정상", "비정상", "고전압", "팬 고장", "방열판"
온도", "현재 한계", "UV 경보 임계값 미만의 전압",
"저전압", "I2C 원격 꺼짐 명령", "MOD_DISABLE 입력" 또는 "단락 핀
이행".
전압 PSU 전압 설정(볼트).
Current PSU 전류 소모량(암페어).
부채 정보
장치에 대한 팬 판독값. 각 팬에 대한 판독값이 제공됩니다.
많은. 모든 S 클래스 제품에 적용됩니다.
주 정부 팬 상태("NORMAL" 또는 "FAILED").
속도 정상적인 팬의 경우 팬 속도(RPM)입니다.
첨부 GPU
장치에 연결된 각 GPU에 해당하는 PCI 버스 ID 목록입니다. 버스
ID는 XNUMX진수로 "domain:bus:device.function" 형식을 갖습니다. 모든 S-클래스 제품에 적용됩니다.
노트
Linux에서 루트로 실행하면 NVIDIA 장치 파일이 nvidia-smi에 의해 수정될 수 있습니다. 봐주세요
드라이버 README 파일의 관련 섹션.
The -a 그리고 -g 인수는 이제 더 이상 사용되지 않습니다. -q 그리고 -i, 각각. 하나,
이전 인수는 이 릴리스에서 계속 작동합니다.
사용 예
엔비디아 smi -q
모든 GPU에 대한 속성을 한 번 쿼리하고 표준 출력에 일반 텍스트로 표시합니다.
엔비디아 smi -q -d ECC, 전원 -i 0 -l 10 -f 아웃.로그
0초 주기로 GPU 10에 대한 ECC 오류 및 전력 소비 쿼리,
무기한으로 out.log 파일에 기록합니다.
엔비디아 smi -c 1 -i GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8
UUID가 있는 GPU의 경우 컴퓨팅 모드를 "EXCLUSIVE_THREAD"로 설정합니다.
"GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8".
엔비디아 smi -q -u -x --dtd
모든 단위에 대한 속성을 한 번 쿼리하고 DTD가 포함된 XML 형식으로 표시하여
표준 출력.
엔비디아 smi --dtd -u -f nvsmi_unit.dtd
단위 DTD를 nvsmi_unit.dtd에 씁니다.
엔비디아 smi -q -d SUPPORTED_CLOCKS
모든 GPU의 지원되는 클록을 표시합니다.
엔비디아 smi -i 0 --응용 프로그램-시계 2500,745
애플리케이션 클록을 2500MHz 메모리 및 745MHz 그래픽으로 설정합니다.
알려진 문제
- Linux에서 X Server가 실행 중인 경우 Compute Processes 섹션에서 사용된 GPU 메모리가
실제 값보다 큰 값을 포함합니다. 이것은 앞으로 수정될 것입니다
놓습니다.
- Linux에서 GOM 변경이 보류 중인 경우 GPU 재설정을 트리거할 수 없습니다.
- Linux에서 GPU 재설정은 보류 중인 ECC 모드를 성공적으로 변경하지 못할 수 있습니다. 전체 재부팅은 다음과 같을 수 있습니다.
모드 변경을 활성화하는 데 필요합니다.
변경 LOG
=== nvidia-smi v4.304 RC와 v4.304 프로덕션 간의 변경 사항 ===
* GPU 작동 모드(GOM) 보고 기능 추가
* GPU 작동 모드를 설정하는 새로운 --gom 스위치 추가
=== nvidia-smi v3.295와 v4.304 RC 간의 변경 사항 ===
* 사용자 피드백으로 인해 장황하지 않은 출력 형식이 변경되었습니다. 에서 보류 중인 정보를 제거했습니다.
테이블.
* 커널 모듈이 수신되지 않아 초기화에 실패할 경우 유용한 메시지 출력
인터럽트
* NVML 공유 라이브러리가 시스템에 없을 때 더 나은 오류 처리
* 새로운 --applications-clocks 스위치 추가
* --display 스위치에 새 필터를 추가했습니다. -d SUPPORTED_CLOCKS와 함께 실행하여 가능한 나열
GPU의 시계
* 여유 메모리 보고 시 반올림 합계 및 사용 메모리에서 계산하므로
가치가 더해지는
* 전원 관리 제한 제한 및 기본 제한에 대한 보고 기능 추가
* 새로운 --power-limit 스위치 추가
* 텍스처 메모리 ECC 오류 보고 추가
* 클럭 스로틀 이유 보고 추가
=== nvidia-smi v2.285와 v3.295 간의 변경 사항 ===
* 실행 명령에 대한 보다 명확한 오류 보고(예: 컴퓨팅 모드 변경)
* 한 번에 여러 GPU에서 명령을 실행할 때 해당 없음 오류는 경고로 처리됩니다.
* nvidia-smi -i는 이제 UUID도 지원합니다.
* UUID 형식이 UUID 표준과 일치하도록 변경되었으며 다른 값을 보고합니다.
=== nvidia-smi v2.0와 v2.285 간의 변경 사항 ===
* VBIOS 버전을 보고합니다.
* 데이터의 일부를 필터링하기 위해 -d/--display 플래그 추가
* PCI 하위 시스템 ID 보고 기능 추가
* M2075 및 C2075를 지원함을 나타내는 업데이트된 문서
* -u 스위치를 사용하여 HIC HWBC 펌웨어 버전 보고
* 현재 클럭 옆에 최대(P0) 클럭 보고
* 장치 또는 장치 DTD를 인쇄하는 --dtd 플래그 추가
* NVIDIA 드라이버가 실행되지 않을 때 메시지 추가
* PCIe 링크 생성(최대 및 현재) 및 링크 너비(최대 및
현재의).
* 보류 중인 드라이버 모델 가져오기는 비관리자에서 작동합니다.
* Windows 게스트 계정에서 nvidia-smi 실행 지원 추가
* -q 명령 없이 nvidia-smi를 실행하면 -q 대신 장황하지 않은 버전이 출력됩니다.
도움
* -l/--loop= 인수의 파싱 수정(기본값, 0, 큰 값)
* pciBusId 형식 변경(XXXX:XX:XX.X로 - 이 변경 사항은 280에서 볼 수 있음)
* -i 명령에 대한 busId의 구문 분석이 덜 제한적입니다. 0:2:0.0 또는
0000:02:00 및 기타 변형
* "드라이버 버전"도 포함하도록 버전 관리 체계 변경
* XML 형식은 오류 조건이 발생하더라도 항상 DTD를 따릅니다.
* 단일 및 이중 비트 ECC 이벤트 및 XID 오류에 대한 지원 추가(기본적으로 활성화됨
-x 플래그에 대해 -l 플래그가 비활성화됨)
* 장치 재설정 -r --gpu-reset 플래그 추가
* 컴퓨팅 실행 프로세스 목록 추가
* 전원 상태를 성능 상태로 변경했습니다. XML 출력에 더 이상 사용되지 않는 지원이 있습니다.
로 작성되어야 합니다.
* 업데이트된 XML 출력과 일치하도록 DTD 버전 번호를 2.0으로 업데이트했습니다.
onworks.net 서비스를 사용하여 alt-nvidia-304-updates-smi 온라인 사용