Dies ist der Befehl alt-nvidia-340-smi, der im kostenlosen OnWorks-Hosting-Provider mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
nvidia-smi – NVIDIA System Management Interface-Programm
ZUSAMMENFASSUNG
nvidia-smi [OPTION1 [ARG1]] [OPTION2 [ARG2]] ...
BESCHREIBUNG
nvidia-smi (auch NVSMI) bietet Überwachungs- und Verwaltungsfunktionen für jeden von ihnen
NVIDIAs Tesla-, Quadro- und GRID-Geräte von Fermi und höheren Architekturfamilien. Sehr
Begrenzte Informationen werden auch für Geforce-Geräte bereitgestellt. NVSMI ist ein plattformübergreifendes Tool
das alle standardmäßigen, von NVIDIA-Treibern unterstützten Linux-Distributionen sowie 64-Bit unterstützt
Versionen von Windows ab Windows Server 2008 R2. Metriken können genutzt werden
direkt von Benutzern über stdout oder als Datei über CSV- und XML-Formate für die Skripterstellung bereitgestellt
Zwecke.
Beachten Sie, dass ein Großteil der Funktionalität von NVSMI durch das zugrunde liegende NVML C-basiert bereitgestellt wird
Bibliothek. Weitere Informationen zu NVML finden Sie unter dem Link zur NVIDIA-Entwickler-Website unten.
NVML-basierte Python-Bindungen sind ebenfalls verfügbar.
Es kann nicht garantiert werden, dass die Ausgabe von NVSMI abwärtskompatibel ist. Allerdings sind sowohl NVML als auch
Die Python-Bindungen sind abwärtskompatibel und sollten beim Schreiben die erste Wahl sein
alle Tools, die in allen NVIDIA-Treiberversionen gewartet werden müssen.
NVML SDK: http://developer.nvidia.com/nvidia-management-library-nvml/
Python Bindungen: http://pypi.python.org/pypi/nvidia-ml-py/
OPTIONAL
ALLGEMEIN OPTIONAL
-H, --help
Nutzungsinformationen drucken und beenden.
ZUSAMMENFASSUNG OPTIONAL
-L, --list-gpus
Listen Sie alle NVIDIA-GPUs im System zusammen mit ihren UUIDs auf.
QUERY OPTIONAL
-Q, --Anfrage
GPU- oder Einheiteninformationen anzeigen. Die angezeigten Informationen umfassen alle im (GPU ATTRIBUTES)
oder (EINHEIT ATTRIBUTES) Abschnitte dieses Dokuments. Bei einigen Geräten und/oder Umgebungen ist dies nicht der Fall
unterstützen alle möglichen Informationen. Alle nicht unterstützten Daten werden durch ein „N/A“ im gekennzeichnet
Ausgang. Standardmäßig werden Informationen zu allen verfügbaren GPUs oder Einheiten angezeigt. Benutzen Sie die -i
Option, um die Ausgabe auf eine einzelne GPU oder Einheit zu beschränken.
[Plus Optional]
-du, --Einheit
Einheitendaten anstelle von GPU-Daten anzeigen. Einheitendaten sind nur für die NVIDIA S-Klasse verfügbar
Tesla-Gehäuse.
-ich, --id=ID
Zeigen Sie Daten für eine einzelne angegebene GPU oder Einheit an. Die angegebene ID kann die GPU/Einheit sein
0-basierter Index in der vom Treiber zurückgegebenen natürlichen Aufzählung, die Seriennummer der GPU-Karte
Nummer, die UUID der GPU oder die PCI-Bus-ID der GPU (als domain:bus:device.function im Hexadezimalformat).
Es wird empfohlen, dass Benutzer, die Konsistenz wünschen, entweder UUID oder PCI-Bus-ID verwenden, da
Es kann nicht garantiert werden, dass die Reihenfolge der Geräteaufzählung zwischen Neustarts und dem Board konsistent ist
Die Seriennummer kann von mehreren GPUs auf demselben Board gemeinsam genutzt werden.
-f DATEI, --filename=DATEI
Leiten Sie die Abfrageausgabe anstelle der Standardausgabe in die angegebene Datei um. Die angegebene
Die Datei wird überschrieben.
-X, --xml-format
Erzeugen Sie eine XML-Ausgabe anstelle des standardmäßigen, für Menschen lesbaren Formats. Sowohl GPU- als auch Unit-Abfrage
Ausgänge entsprechen den entsprechenden DTDs. Diese sind über erhältlich --dtd Flagge.
--dtd
Benutzen mit -x. Betten Sie die DTD in die XML-Ausgabe ein.
-d TYP, --display=TYP
Nur ausgewählte Informationen anzeigen: SPEICHER, AUSNUTZUNG, ECC, TEMPERATUR, LEISTUNG, UHR,
COMPUTE-, PIDS-, PERFORMANCE-, SUPPORTED_CLOCKS-, PAGE_RETIREMENT- und ACCOUNTING-Flags können sein
kombiniert mit Komma zB „MEMORY,ECC“. Abtastdaten mit Max., Min. und Durchschnitt sind ebenfalls verfügbar
Wird für die Anzeigetypen POWER, UTILIZATION und CLOCK zurückgegeben. Funktioniert nicht mit -u/--unit oder
-x/--xml-format-Flags.
-l SEK, --loop=SEC
Melden Sie Abfragedaten kontinuierlich im angegebenen Intervall und nicht im Standardintervall
einmal. Die Anwendung wird zwischen Abfragen in den Ruhezustand versetzt. Beachten Sie, dass unter Linux ECC-Fehler oder XID auftreten
Fehlerereignisse werden während der Ruhephase ausgedruckt, wenn die -x Flag wurde nicht angegeben.
Durch Drücken von Strg+C kann die Schleife jederzeit abgebrochen werden, da sie andernfalls auf unbestimmte Zeit läuft.
Wenn kein Argument für angegeben ist -l Es wird ein Standardintervall von 5 Sekunden verwendet.
SELEKTIV QUERY OPTIONAL
Ermöglicht dem Aufrufer, eine explizite Liste von Eigenschaften zur Abfrage zu übergeben.
[eins von]
--query-gpu=
Informationen zur GPU. Übergeben Sie eine durch Kommas getrennte Liste der Eigenschaften, die Sie abfragen möchten. z.B
--query-gpu=pci.bus_id,persistence_mode. Rufen Sie --help-query-gpu an, um weitere Informationen zu erhalten.
--query-supported-clocks=
Liste der unterstützten Uhren. Rufen Sie --help-query-supported-clocks an, um weitere Informationen zu erhalten.
--query-compute-apps=
Liste der derzeit aktiven Rechenprozesse. Rufen Sie --help-query-compute-apps an, um weitere Informationen zu erhalten.
--query-accounted-apps=
Liste der berücksichtigten Rechenprozesse. Rufen Sie --help-query-accounted-apps an, um weitere Informationen zu erhalten.
--query-retired-pages=
Liste der GPU-Gerätespeicherseiten, die zurückgezogen wurden. Rufen Sie --help-query-retired-pages auf
mehr info
[obligatorisch]
--format=
Durch Kommas getrennte Liste der Formatoptionen:
· csv – durch Kommas getrennte Werte (PFLICHT)
· noheader – erste Zeile mit Spaltenüberschriften überspringen
· Substantive – geben Sie keine Einheiten für numerische Werte aus
[Plus für von]
-ich, --id=ID
Zeigt Daten für eine einzelne angegebene GPU an. Die angegebene ID kann der 0-basierte Index der GPU sein
in der natürlichen Aufzählung, die vom Treiber zurückgegeben wird, die Seriennummer des GPU-Boards, die
Die UUID der GPU oder die PCI-Bus-ID der GPU (als domain:bus:device.function im Hexadezimalformat). Es ist
Benutzern, die Konsistenz wünschen, wird empfohlen, entweder UUID oder PCI-Bus-ID zu verwenden, da Gerät
Es kann nicht garantiert werden, dass die Reihenfolge der Aufzählung zwischen Neustarts und der Seriennummer der Platine konsistent ist
Die Anzahl kann von mehreren GPUs auf demselben Board gemeinsam genutzt werden.
-f DATEI, --filename=DATEI
Leiten Sie die Abfrageausgabe anstelle der Standardausgabe in die angegebene Datei um. Die angegebene
Die Datei wird überschrieben.
-l SEK, --loop=SEC
Melden Sie Abfragedaten kontinuierlich im angegebenen Intervall und nicht im Standardintervall
einmal. Die Anwendung wird zwischen Abfragen in den Ruhezustand versetzt. Beachten Sie, dass unter Linux ECC-Fehler oder XID auftreten
Fehlerereignisse werden während der Ruhephase ausgedruckt, wenn die -x Flag wurde nicht angegeben.
Durch Drücken von Strg+C kann die Schleife jederzeit abgebrochen werden, da sie andernfalls auf unbestimmte Zeit läuft.
Wenn kein Argument für angegeben ist -l Es wird ein Standardintervall von 5 Sekunden verwendet.
-lms ms, --loop-ms=ms
Dasselbe wie -l,--loop, jedoch in Millisekunden.
DEVICE ÄNDERUNG OPTIONAL
[beliebig dank One von]
- Uhr, --persistence-mode=MODUS
Legen Sie den Persistenzmodus für die Ziel-GPUs fest. Siehe die (GPU ATTRIBUTES) Abschnitt für a
Beschreibung des Persistenzmodus. Erfordert Root. Wirkt sich auf alle GPUs aus, außer auf eine einzelne GPU
wird mit angegeben -i Streit. Die Wirkung dieser Operation ist unmittelbar. Jedoch,
Es bleibt bei Neustarts nicht bestehen. Nach jedem Neustart wird der Persistenzmodus standardmäßig aktiviert
"Behinderte". Nur unter Linux verfügbar.
-e, --ecc-config=KONFIG
Legen Sie den ECC-Modus für die Ziel-GPUs fest. Siehe die (GPU ATTRIBUTES) Abschnitt für eine Beschreibung
des ECC-Modus. Erfordert Root. Wirkt sich auf alle GPUs aus, sofern nicht eine einzelne GPU angegeben wird
die -i Streit. Diese Einstellung wird nach dem nächsten Neustart wirksam und bleibt bestehen.
-P, --reset-ecc-errors=TYPE
Setzen Sie die ECC-Fehlerzähler für die Ziel-GPUs zurück. Siehe die (GPU ATTRIBUTES) Abschnitt für a
Beschreibung der ECC-Fehlerzählertypen. Verfügbare Argumente sind 0|VOLATILE oder
1|AGGREGIEREN. Erfordert Root. Wirkt sich auf alle GPUs aus, sofern nicht eine einzelne GPU angegeben wird
die -i Streit. Die Wirkung dieser Operation ist unmittelbar.
-C, --compute-mode=MODUS
Legen Sie den Rechenmodus für die Ziel-GPUs fest. Siehe die (GPU ATTRIBUTES) Abschnitt für a
Beschreibung des Rechenmodus. Erfordert Root. Wirkt sich auf alle GPUs aus, es sei denn, es handelt sich um eine einzelne GPU
angegeben mit -i Streit. Die Wirkung dieser Operation ist unmittelbar. Wie auch immer, es
bleibt nach Neustarts nicht bestehen. Nach jedem Neustart wird der Rechenmodus auf „DEFAULT“ zurückgesetzt.
-dm TYP, --driver-model=TYPE
-fdm TYP, --force-driver-model=TYPE
TCC-Treibermodell aktivieren oder deaktivieren. Nur für Windows. Erfordert Administratorrechte.
-dm schlägt fehl, wenn ein Display angeschlossen ist, aber -fdm wird eine Änderung des Treibermodells erzwingen.
Wirkt sich auf alle GPUs aus, es sei denn, eine einzelne GPU wird mit angegeben -i Streit. Ein Neustart ist
erforderlich, damit die Änderung stattfinden kann. Sehen LED Treiber Modell Weitere Informationen zu Windows finden Sie hier
Fahrermodelle.
--gom=MODUS
Stellen Sie den GPU-Betriebsmodus ein: 0/ALL_ON, 1/COMPUTE, 2/LOW_DP. Unterstützt auf GK110 M-Klasse und X-
erstklassige Tesla-Produkte aus der Kepler-Familie. Nicht unterstützt auf Quadro und Tesla C-Klasse
Produkte. Erfordert Administratorrechte. Sehen GPU Produktion Model zu weiteren Informationen und Erklärungen
über GOM. GOM-Änderungen werden nach dem Neustart wirksam. Die Neustartanforderung wird möglicherweise entfernt
in der Zukunft. Reine Computing-GOMs unterstützen kein WDDM (Windows Display Driver Model).
-R, --gpu-reset
Lösen Sie einen Reset der GPU aus. Kann verwendet werden, um den GPU-HW- und SW-Status in Situationen zu löschen, in denen dies der Fall ist
Andernfalls wäre ein Neustart des Computers erforderlich. Typischerweise nützlich, wenn ein Doppelbit-ECC-Fehler vorliegt
geschah. Erfordert -i Wechseln Sie zum Zielgerät. Erfordert Root. Das kann es nicht geben
alle Anwendungen, die dieses bestimmte Gerät verwenden (z. B. CUDA-Anwendung, Grafikanwendung).
wie X-Server, Überwachungsanwendung wie andere Instanzen von nvidia-smi). Dort auch
Es dürfen keine Rechenanwendungen auf einer anderen GPU im System ausgeführt werden. Nur an
unterstützte Geräte der Fermi- und Kepler-Familie, die unter Linux laufen.
Es ist nicht garantiert, dass das Zurücksetzen der GPU in allen Fällen funktioniert. Es wird nicht für die Produktion empfohlen
Umgebungen zu diesem Zeitpunkt. In manchen Situationen können HW-Komponenten auf der Platine vorhanden sein
die nach der Rücksetzanforderung nicht in den Ausgangszustand zurückkehren. Das ist mehr
ist wahrscheinlich bei Produkten der Fermi-Generation im Vergleich zu Kepler zu sehen und wahrscheinlicher, wenn
Der Reset wird auf einer hängenden GPU durchgeführt.
Nach einem Reset wird empfohlen, vor weiteren Schritten den Zustand der GPU zu überprüfen
verwenden. Für diesen Test ist das Tool nvidia-healthmon eine gute Wahl. Wenn die GPU nicht fehlerfrei ist
Ein vollständiger Reset sollte durch Aus- und Wiedereinschalten des Knotens eingeleitet werden.
Besuchen Sie http://developer.nvidia.com/gpu-deployment-kit um das GDK und nvidia herunterzuladen
Gesundheitsmon.
-ac, --applications-clocks=MEM_CLOCK,GRAPHICS_CLOCK
Gibt das Maximum an Takte als Paar (z. B. 2000,800), das GPUs definiert
Geschwindigkeit beim Ausführen von Anwendungen auf einer GPU. Nur auf Tesla-Geräten der Kepler+-Familie.
Erfordert Root, es sei denn, die Einschränkungen werden mit dem Befehl -acp gelockert.
-rac, --reset-applications-clocks
Setzt die Anwendungsuhren auf den Standardwert zurück. Nur auf Tesla-Geräten von Kepler+
Familie. Erfordert Root, es sei denn, die Einschränkungen werden mit dem Befehl -acp gelockert.
-acp, --applications-clocks-permission=MODUS
Schalten Sie um, ob die Anwendungsuhren von allen Benutzern oder nur von Root geändert werden können. Verfügbar
Argumente sind 0|UNRESTRICTED, 1|RESTRICTED. Nur auf Tesla-Geräten ab Kepler+
Familie. Erfordert Root.
-pl, --power-limit=POWER_LIMIT
Gibt die maximale Leistungsgrenze in Watt an. Akzeptiert Ganzzahl- und Gleitkommazahlen. Nur
auf unterstützten Geräten der Kepler-Familie. Erfordert Administratorrechte. Wertbedürfnisse
liegt zwischen der minimalen und maximalen Leistungsgrenze, wie von nvidia-smi gemeldet.
-bin, --accounting-mode=MODUS
Aktiviert oder deaktiviert die GPU-Buchhaltung. Mit GPU Accounting kann man die Nutzung verfolgen
Ressourcen während der gesamten Lebensdauer eines einzelnen Prozesses. Nur auf unterstützten Geräten von Kepler
Familie. Erfordert Administratorrechte. Verfügbare Argumente sind 0|DISABLED oder
1|AKTIVIERT.
-caa, --clear-accounted-apps
Löscht alle bisher berücksichtigten Prozesse. Nur auf unterstützten Geräten der Kepler-Familie.
Erfordert Administratorrechte.
--auto-boost-default=MODUS
Legen Sie die standardmäßige Auto-Boost-Richtlinie auf 0/DEAKTIVIERT oder 1/AKTIVIERT fest und erzwingen Sie nur die Änderung
nachdem der letzte Boost-Client beendet wurde. Nur auf bestimmten Tesla-Geräten ab Kepler+
Familie. Erfordert Root.
--auto-boost-default-force=MODUS
Setzen Sie die standardmäßige Auto-Boost-Richtlinie auf 0/DEAKTIVIERT oder 1/AKTIVIERT, um die Änderung zu erzwingen
sofort. Nur auf bestimmten Tesla-Geräten der Kepler+-Familie. Erfordert Root.
--auto-boost-permission=MODUS
Ermöglichen Sie Nicht-Administrator-/Root-Kontrolle über den Auto-Boost-Modus. Verfügbare Argumente sind
0|UNEINGESCHRÄNKT, 1|EINGESCHRÄNKT. Nur auf bestimmten Tesla-Geräten der Kepler+-Familie.
Benötigt Wurzel.
[Plus Optional]
-ich, --id=ID
Ändern Sie eine einzelne angegebene GPU. Die angegebene ID kann der 0-basierte Index der GPU/Einheit sein
die vom Treiber zurückgegebene natürliche Aufzählung, die Seriennummer des GPU-Boards, die GPUs
UUID oder die PCI-Bus-ID der GPU (als domain:bus:device.function im Hexadezimalformat). Es wird empfohlen
dass Benutzer, die Konsistenz wünschen, seit der Geräteaufzählung entweder UUID oder PCI-Bus-ID verwenden
Es kann nicht garantiert werden, dass die Bestellung zwischen Neustarts und der Seriennummer der Platine konsistent ist
von mehreren GPUs auf demselben Board gemeinsam genutzt werden.
EINHEIT ÄNDERUNG OPTIONAL
-T, --toggle-led=STATE
Stellen Sie den LED-Anzeigestatus auf der Vorder- und Rückseite des Geräts auf die angegebene Farbe ein. Sehen
das (EINHEIT ATTRIBUTES) Abschnitt für eine Beschreibung der LED-Zustände. Zulässige Farben sind
0|GRÜN und 1|BERNSTEIN. Erfordert Root.
[Plus Optional]
-ich, --id=ID
Ändern Sie eine einzelne angegebene Einheit. Die angegebene ID ist der 0-basierte Index der Einheit im
Natürliche Aufzählung, die vom Treiber zurückgegeben wird.
SHOW DTD OPTIONAL
--dtd
Geräte- oder Einheiten-DTD anzeigen.
[Plus Optional]
-f DATEI, --filename=DATEI
Leiten Sie die Abfrageausgabe anstelle der Standardausgabe in die angegebene Datei um. Die angegebene
Die Datei wird überschrieben.
-du, --Einheit
Anzeigeeinheits-DTD anstelle der Geräte-DTD.
Statistik
Zeigt Statistikinformationen zur GPU an. Für weitere Informationen verwenden Sie „nvidia-smi stats -h“.
Information. Nur Linux.
topo
Topologieinformationen zum System anzeigen. Für weitere Informationen verwenden Sie „nvidia-smi topo -h“.
Information. Nur Linux. Hinweis: Die GPU-Aufzählung ist dieselbe wie bei NVML.
RÜCKKEHR Mehrwert
Der Rückgabecode gibt an, ob der Vorgang erfolgreich war oder fehlgeschlagen ist und was der Grund dafür war
Fehler.
· Rückkehrcode 0 – Erfolg
· Rückkehrcode 2 – Ein angegebenes Argument oder Flag ist ungültig
· Rückkehrcode 3 – Der angeforderte Vorgang ist auf dem Zielgerät nicht verfügbar
· Rückkehrcode 4 – Der aktuelle Benutzer hat keine Berechtigung, auf dieses Gerät zuzugreifen oder
Führen Sie diesen Vorgang aus
· Rückkehrcode 6 – Eine Suche nach einem Objekt war nicht erfolgreich
· Rückkehrcode 8 – Die externen Stromkabel eines Geräts sind nicht richtig angeschlossen
· Rückkehrcode 9 – NVIDIA-Treiber ist nicht geladen
· Rückkehrcode 10 – Der NVIDIA-Kernel hat ein Interrupt-Problem mit einer GPU erkannt
· Rückkehrcode 12 – Die gemeinsam genutzte NVML-Bibliothek konnte nicht gefunden oder geladen werden
· Rückkehrcode 13 – Die lokale Version von NVML implementiert diese Funktion nicht
· Rückkehrcode 14 – infoROM ist beschädigt
· Rückkehrcode 15 – Die GPU ist vom Bus abgefallen oder auf andere Weise beschädigt worden
unzugänglich
· Rückkehrcode 255 – Anderer Fehler oder interner Treiberfehler aufgetreten
GPU ATTRIBUTES
Die folgende Liste beschreibt alle möglichen Daten, die von zurückgegeben werden -q Option zur Geräteabfrage.
Sofern nicht anders angegeben, basieren alle numerischen Ergebnisse auf der Basis 10 und ohne Einheit.
Timestamp
Der aktuelle Systemzeitstempel zum Zeitpunkt des Aufrufs von nvidia-smi. Das Format ist „Wochentag“.
Monat Tag HH:MM:SS Jahr“.
LED Treiber Version
Die Version des installierten NVIDIA-Anzeigetreibers. Dies ist eine alphanumerische Zeichenfolge.
Beigefügt GPUs
Die Anzahl der NVIDIA-GPUs im System.
Produkt Name
Der offizielle Produktname der GPU. Dies ist eine alphanumerische Zeichenfolge. Für alle Produkte.
Display Model
Ein Flag, das angibt, ob derzeit eine physische Anzeige (z. B. ein Monitor) angeschlossen ist
einen der Anschlüsse der GPU. „Aktiviert“ zeigt eine angeschlossene Anzeige an. "Deaktiviert"
weist auf etwas anderes hin.
Display Aktives
Ein Flag, das angibt, ob eine Anzeige auf der GPU initialisiert ist (z. B. Speicher).
auf dem Gerät zur Anzeige zugeordnet). Die Anzeige kann auch dann aktiv sein, wenn kein Monitor vorhanden ist
körperlich verbunden. „Enabled“ zeigt eine aktive Anzeige an. „Deaktiviert“ zeigt an
Andernfalls.
Beharrlichkeit Model
Ein Flag, das angibt, ob der Persistenzmodus für die GPU aktiviert ist. Wert ist entweder
„Aktiviert“ oder „Deaktiviert“. Wenn der Persistenzmodus aktiviert ist, bleibt der NVIDIA-Treiber erhalten
wird auch dann geladen, wenn keine aktiven Clients wie X11 oder nvidia-smi vorhanden sind. Dies minimiert die
Treiberladelatenz im Zusammenhang mit der Ausführung abhängiger Apps, wie z. B. CUDA-Programmen. Für
alle CUDA-fähigen Produkte. Nur Linux.
Buchhaltung Model
Ein Flag, das angibt, ob der Abrechnungsmodus für den GPU-Wert aktiviert ist, ist entweder „Wann“.
Wenn die Buchhaltung aktiviert ist, werden Statistiken für jeden Rechenprozess berechnet, der auf dem ausgeführt wird
GPU. Nach Beendigung des Prozesses stehen Statistiken zur Abfrage zur Verfügung. Siehe --help-query-
Weitere Informationen finden Sie unter Accounted-Apps.
Buchhaltung Model Puffer Größe
Gibt die Größe des Ringpuffers zurück, der eine Liste der Prozesse enthält, die abgefragt werden können
für Buchhaltungsstatistiken. Dies ist die maximale Anzahl von Prozessen, die Buchhaltungsinformationen verarbeiten
werden gespeichert, bevor Informationen über älteste Prozesse überschrieben werden
Informationen über neue Prozesse.
LED Treiber Modell
Unter Windows werden die TCC- und WDDM-Treibermodelle unterstützt. Das Treibermodell kann geändert werden
mit dem (-dm) Or (-fdm) Flaggen. Das TCC-Treibermodell ist für die Datenverarbeitung optimiert
Anwendungen. Die Startzeiten des IE-Kernels werden mit TCC schneller sein. Das WDDM-Treibermodell
ist für Grafikanwendungen konzipiert und wird nicht für Computeranwendungen empfohlen.
Linux unterstützt nicht mehrere Treibermodelle und hat immer den Wert „N/A“.
Aktuell Das derzeit verwendete Treibermodell. Unter Linux immer „N/A“.
Zu überprüfen Das Treibermodell, das beim nächsten Neustart verwendet wird. Immer „N/A“ an
Linux.
Seriell Nummer
Diese Nummer stimmt mit der Seriennummer überein, die physisch auf jeder Platine aufgedruckt ist. Es ist ein globales
eindeutiger unveränderlicher alphanumerischer Wert.
GPU UUID
Dieser Wert ist die weltweit eindeutige unveränderliche alphanumerische Kennung der GPU. Es tut
entsprechen keinem physischen Etikett auf der Platine.
Moll Nummer
Die Minor-Nummer für das Gerät ist so, dass die Nvidia-Geräteknotendatei für jede GPU verwendet wird
haben die Form /dev/nvidia[Nebenzahl]. Nur auf der Linux-Plattform verfügbar.
VBIOS Version
Das BIOS des GPU-Boards.
MultiGPU Board
Ob diese GPU Teil eines MultiGPU-Boards ist oder nicht.
Board ID
Die vom Fahrer zugewiesene eindeutige Board-ID. Wenn zwei oder mehr GPUs dieselbe Board-ID haben
und das obige Feld „MultiGPU“ zutrifft, dann befinden sich die GPUs auf derselben Platine.
Informationen Version
Versionsnummern für jedes Objekt im Inforom-Speicher des GPU-Boards. Die Information ist ein
kleiner, persistenter Speicher von Konfigurations- und Zustandsdaten für die GPU. Alle Informationen aus der Version
Felder sind numerisch. Für einige GPUs kann es hilfreich sein, diese Versionsnummern zu kennen
Funktionen sind nur mit Inforoms einer bestimmten Version oder höher verfügbar.
Wenn in einem der folgenden Felder „Unknown Error“ (Unbekannter Fehler) zurückgegeben wird, erfolgt eine zusätzliche Infrom-Überprüfung
durchgeführt und die entsprechende Warnmeldung wird angezeigt.
Bild Version Globale Version des infoROM-Images. Image-Version genau wie VBIOS-Version
Beschreibt eindeutig die genaue Version des InfoROMs, das auf der Platine geflasht ist
Im Gegensatz zur InfoROM-Objektversion, die nur ein Indikator für die Unterstützung ist
Funktionen.
OEM Betreff Version für die OEM-Konfigurationsdaten.
ECC Betreff Version für die ECC-Aufzeichnungsdaten.
Strom Betreff Version für die Energieverwaltungsdaten.
GPU Produktion Model
GOM ermöglicht die Reduzierung des Stromverbrauchs und die Optimierung des GPU-Durchsatzes durch Deaktivierung von GPU-Funktionen.
Jedes GOM ist darauf ausgelegt, spezifische Benutzeranforderungen zu erfüllen.
Im „All On“-Modus ist alles aktiviert und läuft auf Hochtouren.
Der Modus „Compute“ ist nur für die Ausführung von Compute-Aufgaben vorgesehen. Grafikoperationen sind nicht möglich
erlaubt.
Der Modus „Low Double Precision“ ist für die Ausführung von Grafikanwendungen konzipiert, bei denen dies nicht der Fall ist
erfordern doppelte Präzision mit hoher Bandbreite.
GOM kann mit ( geändert werden)--gom) Flagge.
Unterstützt auf GK110 M-Klasse- und X-Klasse-Tesla-Produkten der Kepler-Familie. Nicht
Wird auf Quadro- und Tesla C-Klasse-Produkten unterstützt.
Aktuell Das derzeit verwendete GOM.
Zu überprüfen Das GOM, das beim nächsten Neustart verwendet wird.
PCI
Grundlegende PCI-Informationen für das Gerät. Einige dieser Informationen können sich ändern, wenn Karten verfügbar sind
in einem System hinzugefügt/entfernt/verschoben werden. Für alle Produkte.
Bus PCI-Busnummer, in Hex
Gerät PCI-Gerätenummer, hexadezimal
Domain PCI-Domänennummer, hexadezimal
Gerät Id Geräte-ID des PCI-Anbieters, hexadezimal
Sub System Id PCI-Subsystem-ID, hexadezimal
Bus Id PCI-Bus-ID als „domain:bus:device.function“, im Hexadezimalformat
GPU Link Information
Die PCIe-Link-Generation und Busbreite
Aktuell Die aktuelle Linkgeneration und -breite. Diese können bei der GPU reduziert werden
ist nicht in Gebrauch.
Maximal Die maximale Link-Generierung und -Breite, die mit dieser GPU und diesem System möglich ist
Aufbau. Beispielsweise, wenn die GPU eine höhere PCIe-Generation unterstützt
als das System unterstützt, meldet dies die System-PCIe-Generierung.
Bridge Chip
Informationen zum Bridge-Chip auf dem Gerät. Die Bridge-Chip-Firmware ist nur vorhanden
auf bestimmten Boards und zeigt möglicherweise „N/A“ für einige neuere MultiGPU-Boards an.
Typ Der Typ des Brückenchips. Wird als N/A gemeldet, falls nicht vorhanden.
Firmware Version
Die Firmware-Version des Bridge-Chips. Wird als N/A gemeldet, falls nicht vorhanden.
Ventilator Schnelligkeit
Der Lüftergeschwindigkeitswert ist der Prozentsatz der maximalen Geschwindigkeit, die der Lüfter des Geräts derzeit hat
soll laufen. Der Bereich liegt zwischen 0 und 100 %. Hinweis: Die angegebene Geschwindigkeit ist die beabsichtigte
Lüftergeschwindigkeit. Wenn der Lüfter physisch blockiert ist und sich nicht drehen kann, funktioniert dieser Ausgang nicht
der tatsächlichen Lüftergeschwindigkeit entsprechen. Viele Teile melden keine Lüftergeschwindigkeiten, weil sie darauf angewiesen sind
Kühlung über Lüfter im Umgehäuse. Für alle diskreten Produkte mit dediziertem
Fans.
Leistung Staat
Der aktuelle Leistungsstatus der GPU. Die Zustände reichen von P0 (maximale Leistung) bis
P12 (Mindestleistung).
Uhren Throttle Gründe
Ruft Informationen über Faktoren ab, die die Taktfrequenz reduzieren. Nur an
unterstützte Tesla-Geräte der Kepler-Familie.
Wenn alle Drosselungsgründe als „Nicht aktiv“ zurückgegeben werden, bedeutet dies, dass die Uhren wie folgt laufen
hoch wie möglich.
Leerlauf Auf der GPU läuft nichts und die Takte fallen in den Leerlaufzustand.
Dieser Begrenzer wird möglicherweise in einer späteren Version entfernt.
Antragsprozess Uhren Rahmen
GPU-Takte werden durch die Einstellung der Anwendungsuhren begrenzt. ZB kann geändert werden
mit nvidia-smi --applications-clocks=
SW Strom Kappe Der SW Power Scaling-Algorithmus reduziert die Takte unter die angeforderten Takte
weil die GPU zu viel Strom verbraucht. ZB kann die SW-Leistungsbegrenzung begrenzt werden
kann mit nvidia-smi --power-limit= geändert werden
HW Langsamer Die HW-Verlangsamung (Reduzierung der Kerntakte um den Faktor 2 oder mehr) ist aktiviert.
Dies ist ein Indikator für:
* Die Temperatur ist zu hoch
* Die Aktivierung der externen Leistungsbremse wird ausgelöst (z. B. durch die Systemleistung).
liefern)
* Der Stromverbrauch ist zu hoch und der Fast-Trigger-Schutz reduziert die Takte
Unbekannt Ein anderer nicht näher bezeichneter Faktor reduziert die Taktraten.
FB Memory Anwendungsbereich
Informationen zum integrierten Bildpufferspeicher. Der gemeldete Gesamtspeicher wird vom ECC-Status beeinflusst.
Wenn ECC aktiviert ist, verringert sich der insgesamt verfügbare Speicher um mehrere Prozent
erforderlichen Paritätsbits. Der Treiber reserviert möglicherweise auch eine kleine Menge Speicher für den internen Speicher
nutzen, auch ohne aktive Arbeit an der GPU. Für alle Produkte.
Total Gesamtgröße des FB-Speichers.
Gebrauchte Verwendete Größe des FB-Speichers.
Frei Verfügbare Größe des FB-Speichers.
BAR1 Memory Anwendungsbereich
BAR1 wird verwendet, um den FB (Gerätespeicher) so abzubilden, dass die CPU direkt darauf zugreifen kann
oder durch Geräte von Drittanbietern (Peer-to-Peer auf dem PCIe-Bus).
Total Gesamtgröße des BAR1-Speichers.
Gebrauchte Verwendete Größe des BAR1-Speichers.
Frei Verfügbare Größe des BAR1-Speichers.
Berechnen Model
Das Compute-Modus-Flag gibt an, ob einzelne oder mehrere Computing-Anwendungen dies tun können
auf der GPU laufen.
„Standard“ bedeutet, dass pro Gerät mehrere Kontexte zulässig sind.
„Exklusiver Thread“ bedeutet, dass pro Gerät nur ein Kontext zulässig ist, der von einem Thread aus verwendet werden kann
eine Zeit.
„Exklusiver Prozess“ bedeutet, dass pro Gerät nur ein Kontext zulässig ist, der von mehreren verwendet werden kann
Threads gleichzeitig.
„Verboten“ bedeutet, dass pro Gerät keine Kontexte zulässig sind (keine Compute-Apps).
„EXCLUSIVE_PROCESS“ wurde in CUDA 4.0 hinzugefügt. Frühere CUDA-Versionen unterstützten nur eine
Exklusivmodus, der „EXCLUSIVE_THREAD“ in CUDA 4.0 und höher entspricht.
Für alle CUDA-fähigen Produkte.
Nutzung
Auslastungsraten geben an, wie ausgelastet jede GPU im Laufe der Zeit ist, und können verwendet werden, um zu bestimmen, wie
Inwieweit nutzt eine Anwendung die GPUs im System?
Hinweis: Während der Treiberinitialisierung kann bei aktiviertem ECC eine hohe GPU- und Speicherleistung festgestellt werden
Auslastungswerte. Dies wird durch den ausgeführten ECC-Memory-Scrubbing-Mechanismus verursacht
während der Treiberinitialisierung.
GPU Prozentsatz der Zeit im vergangenen Stichprobenzeitraum, in dem eine oder mehrere
Kernel wurde auf der GPU ausgeführt. Der Abtastzeitraum kann zwischen 1 und XNUMX liegen
Sekunde und 1/6 Sekunde, je nach Produkt.
Memory Prozentsatz der Zeit im vergangenen Stichprobenzeitraum, in der global (Gerät)
Der Speicher wurde gelesen oder geschrieben. Der Abtastzeitraum kann zwischen 1 und XNUMX liegen
Sekunde und 1/6 Sekunde, je nach Produkt.
Ecc Model
Ein Flag, das angibt, ob die ECC-Unterstützung aktiviert ist. Kann entweder „Aktiviert“ oder sein
"Behinderte". Änderungen am ECC-Modus erfordern einen Neustart. Erfordert die Version des Infrom ECC-Objekts
1.0 oder höher.
Aktuell Der ECC-Modus, in dem die GPU derzeit arbeitet.
Zu überprüfen Der ECC-Modus, in dem die GPU nach dem nächsten Neustart betrieben wird.
ECC Fehler
NVIDIA-GPUs können Fehlerzählungen für verschiedene Arten von ECC-Fehlern bereitstellen. Einige ECC-Fehler sind
entweder Einzel- oder Doppelbitfehler, wobei Einzelbitfehler und Doppelbitfehler korrigiert werden
sind nicht korrigierbar. Texturspeicherfehler können durch erneutes Senden korrigierbar oder nicht korrigierbar sein
wenn das erneute Senden fehlschlägt. Diese Fehler sind über zwei Zeitskalen verfügbar (volatil und).
Aggregat). Einzelbit-ECC-Fehler werden von der HW automatisch korrigiert und treten nicht auf
bei Datenkorruption. Doppelbitfehler werden erkannt, aber nicht korrigiert. Bitte sehen Sie sich das ECC an
Dokumente im Internet finden Sie Informationen zum Verhalten von Computeranwendungen bei Doppelbit
Fehler passieren. Volatile Fehlerzähler verfolgen die Anzahl der seit dem letzten Fehler erkannten Fehler
Fahrerlast. Die aggregierten Fehlerzählungen bleiben auf unbestimmte Zeit bestehen und gelten somit lebenslang
entgegenzuwirken.
Ein Hinweis zu flüchtigen Zählungen: Unter Windows ist dies einmal pro Start. Unter Linux kann das mehr sein
häufig. Unter Linux wird der Treiber entladen, wenn keine aktiven Clients vorhanden sind. Daher, wenn
Dann ist der Persistenzmodus aktiviert oder es ist immer ein Treiber-Client aktiv (z. B. X11).
Linux erkennt auch ein Pro-Boot-Verhalten. Wenn nicht, werden die flüchtigen Zähler bei jeder Berechnung zurückgesetzt
App wird ausgeführt.
Tesla- und Quadro-Produkte der Fermi- und Kepler-Familie können einen Gesamt-ECC-Fehler anzeigen
Zählungen sowie eine Aufschlüsselung der Fehler basierend auf der Position auf dem Chip. Die Standorte sind
nachstehend beschrieben. Standortbasierte Daten für aggregierte Fehlerzählungen erfordern Infrom ECC
Objektversion 2.0. Alle anderen ECC-Zählungen erfordern die ECC-Objektversion 1.0.
Gerät Memory Im globalen Gerätespeicher wurden Fehler erkannt.
Registrieren Reichen Sie das Im Registerdateispeicher wurden Fehler erkannt.
L1 Cache Im L1-Cache wurden Fehler erkannt.
L2 Cache Im L2-Cache wurden Fehler erkannt.
Texture Memory Paritätsfehler im Texturspeicher erkannt.
Total Gesamtzahl der auf dem gesamten Chip erkannten Fehler. Die Summe von Gerät Memory, Registrieren
Reichen Sie das, L1 Cache, L2 Cache und Texture Memory.
Seite Ruhestand
NVIDIA-GPUs können Seiten des GPU-Gerätespeichers zurückziehen, wenn sie unzuverlässig werden. Das kann
passieren, wenn mehrere Einzelbit-ECC-Fehler für dieselbe Seite oder auf einem Doppelbit-ECC auftreten
Fehler. Wenn eine Seite außer Betrieb genommen wird, wird sie vom NVIDIA-Treiber ausgeblendet, sodass kein Treiber mehr vorhanden ist
Anwendungsspeicherzuordnungen können darauf zugreifen.
Doppelt Bit ECC Die Anzahl der GPU-Gerätespeicherseiten, die aufgrund von a außer Betrieb genommen wurden
Doppelbit-ECC-Fehler.
Einwellig Bit ECC Die Anzahl der GPU-Gerätespeicherseiten, die aufgrund von stillgelegt wurden
mehrere Einzelbit-ECC-Fehler.
Zu überprüfen Überprüft, ob GPU-Gerätespeicherseiten beim nächsten Neustart gelöscht werden müssen.
Seiten, deren Stilllegung noch aussteht, können weiterhin zugewiesen werden und können weitere Probleme verursachen
Zuverlässigkeitsprobleme.
Temperaturen
Messwerte von Temperatursensoren auf der Platine. Alle Messwerte sind in Grad C angegeben. Nicht alle
Produkte unterstützen alle Lesearten. Dies gilt insbesondere für Produkte in Modulform
Wenn Sie sich auf Gehäuselüfter oder passive Kühlung verlassen, liefern sie normalerweise keine Temperaturwerte. Sehen
Unten finden Sie Informationen zu Einschränkungen.
GPU Kern-GPU-Temperatur. Für alle diskreten und S-Klasse-Produkte.
Strom Readings
Leistungsmessungen helfen dabei, Aufschluss über den aktuellen Stromverbrauch der GPU und die Faktoren zu geben
die diese Nutzung beeinflussen. Wenn die Energieverwaltung aktiviert ist, begrenzt die GPU den Stromverbrauch
Sie können die Last so anpassen, dass sie in einen vordefinierten Leistungsbereich passt, indem Sie die aktuelle Leistung manipulieren
Zustand. Die Verfügbarkeitsgrenzen finden Sie weiter unten.
Strom Staat Power State ist veraltet und wurde in Performance State umbenannt
2.285. Um die XML-Kompatibilität aufrechtzuerhalten, lautet der Performance-Status im XML-Format
an beiden Orten aufgeführt.
Strom Management
Ein Flag, das angibt, ob die Energieverwaltung aktiviert ist. Entweder
„Unterstützt“ oder „N/A“. Erfordert Infrom PWR-Objektversion 3.0 oder höher oder
Kepler-Gerät.
Strom Unentschieden Die zuletzt gemessene Leistungsaufnahme für die gesamte Platine in Watt. Nur
verfügbar, wenn Energieverwaltung unterstützt wird. Diese Lesart ist genau
innerhalb von +/- 5 Watt. Erfordert Infrom PWR-Objektversion 3.0 oder höher oder
Kepler-Gerät.
Strom Einschränkung Das Software-Leistungslimit in Watt. Wird von Software wie nvidia-smi festgelegt.
Nur verfügbar, wenn Energieverwaltung unterstützt wird. Erfordert Informationen von PWR
Objektversion 3.0 oder höher oder Kepler-Gerät. Auf Kepler-Geräten Power
Der Grenzwert kann mit den Schaltern -pl,--power-limit= angepasst werden.
Gesetzt Strom Einschränkung
Die Leistungsobergrenze des Energieverwaltungsalgorithmus in Watt. Gesamtpension
Der Stromverbrauch wird durch den Energieverwaltungsalgorithmus so manipuliert, dass er
bleibt unter diesem Wert. Dieser Grenzwert ist das Minimum verschiedener Grenzwerte wie z
als das oben aufgeführte Softwarelimit. Nur verfügbar, wenn die Energieverwaltung aktiviert ist
unterstützt. Erfordert ein Kepler-Gerät.
Standard Strom Einschränkung
Die Leistungsobergrenze des standardmäßigen Energieverwaltungsalgorithmus in Watt. Leistung
Das Limit wird nach dem Entladen des Treibers auf das Standard-Leistungslimit zurückgesetzt. Nur an
Unterstützte Geräte der Kepler-Familie.
Min. Strom Einschränkung
Der Mindestwert in Watt, auf den die Leistungsgrenze eingestellt werden kann. Nur an
Unterstützte Geräte der Kepler-Familie.
Max Strom Einschränkung
Der maximale Wert in Watt, auf den die Leistungsgrenze eingestellt werden kann. Nur an
Unterstützte Geräte der Kepler-Familie.
Uhren
Aktuelle Frequenz, mit der Teile der GPU ausgeführt werden. Alle Messwerte sind in MHz.
Grafiken Aktuelle Frequenz des Grafik-(Shader-)Takts.
SM Aktuelle Frequenz des SM-Takts (Streaming Multiprocessor).
Memory Aktuelle Frequenz des Speichertakts.
Anwendungen Uhren
Vom Benutzer angegebene Häufigkeit, mit der Anwendungen ausgeführt werden. Kann mit geändert werden
[-ac | --applications-clocks] wechselt.
Grafiken Vom Benutzer angegebene Frequenz des Grafik-(Shader-)Takts.
Memory Vom Benutzer angegebene Frequenz des Speichertakts.
Standard Anwendungen Uhren
Standardfrequenz, mit der Anwendungen ausgeführt werden. Anwendungsuhren können sein
geändert mit [-ac | --applications-clocks] wechselt. Anwendungsuhren können eingestellt werden
Standardmäßig wird [-rac | verwendet --reset-applications-clocks] Schalter.
Grafiken Standardfrequenz des Grafiktakts (Shader) der Anwendung.
Memory Standardfrequenz des Anwendungsspeichertakts.
Max Uhren
Maximale Frequenz, mit der Teile der GPU ausgeführt werden sollen. Alle Messwerte sind in MHz.
Auf GPUs der Fermi-Familie können die aktuellen P0-Uhren (siehe Abschnitt „Uhren“) abweichen
maximale Takte um einige MHz.
Grafiken Maximale Frequenz des Grafik-(Shader-)Takts.
SM Maximale Frequenz des SM-Takts (Streaming Multiprocessor).
Memory Maximale Frequenz des Speichertakts.
Uhr Politik
Benutzerdefinierte Einstellungen für automatische Taktänderungen wie Auto-Boost.
Auto Boost Gibt an, ob der Auto-Boost-Modus derzeit für diese GPU aktiviert ist (Ein) oder
für diese GPU deaktiviert (Aus). Zeigt (N/A) an, wenn Boost nicht unterstützt wird. Auto
Boost ermöglicht eine dynamische GPU-Taktung basierend auf Leistung, Wärme und Auslastung.
Wenn der automatische Boost deaktiviert ist, versucht die GPU, die Taktrate beizubehalten
genau die Einstellungen für die aktuellen Anwendungsuhren (wann immer ein CUDA-Kontext vorliegt).
ist aktiv). Bei aktivierter Auto-Boost-Funktion versucht die GPU weiterhin, die Leistung beizubehalten
Diese Etage wird aber opportunistisch auf höhere Takte angehoben, wenn Leistung,
Wärme- und Nutzungsspielraum ermöglichen. Diese Einstellung bleibt lebenslang bestehen
des CUDA-Kontexts, für den es angefordert wurde. Apps können eine anfordern
bestimmten Modus entweder über einen NVML-Aufruf (siehe NVML SDK) oder durch Festlegen des
CUDA-Umgebungsvariable CUDA_AUTO_BOOST.
Auto Boost Standard
Zeigt die Standardeinstellung für den Auto-Boost-Modus an, entweder aktiviert (Ein) oder
deaktiviert (Aus). Zeigt (N/A) an, wenn Boost nicht unterstützt wird. Apps werden im ausgeführt
Standardmodus, wenn sie nicht explizit einen bestimmten Modus angefordert haben.
Unterstützte Uhren
Liste möglicher Speicher- und Grafiktaktkombinationen, mit denen die GPU betrieben werden kann (nicht).
unter Berücksichtigung HW-bremsreduzierter Takte). Dies sind die einzigen Uhrenkombinationen, die
kann an das Flag --applications-clocks übergeben werden. Unterstützte Uhren werden nur aufgeführt, wenn -q -d
SUPPORTED_CLOCKS-Schalter werden bereitgestellt oder im XML-Format.
Berechnen Prozesse
Liste der Prozesse mit Rechenkontext auf dem Gerät.
Jeder Eintrag hat das Format „ . "
Gebrauchte GPU Memory
Vom Kontext auf dem Gerät genutzter Speicher. Unter Windows nicht verfügbar
bei Ausführung im WDDM-Modus, da Windows KMD nicht den gesamten Speicher verwaltet
NVIDIA-Treiber.
Stats (EXPERIMENTAL)
Listen Sie GPU-Statistiken wie Leistungsbeispiele, Auslastungsbeispiele, XID-Ereignisse und Taktänderungen auf
Ereignis- und Verstoßzähler.
Unterstützt auf Tesla-, GRID- und Quadro-basierten Produkten unter Linux.
Beschränkt auf Kepler oder neuere GPUs.
Zeigt Statistiken im CSV-Format wie folgt an:
, , ,
Die mit ihren Einheiten anzuzeigenden Metriken lauten wie folgt:
Leistungsbeispiele in Watt.
GPU-, Speicher-, Encoder- und Decoder-Auslastungsbeispiele in Prozent.
Xid-Fehlerereignisse, die mit dem Xid-Fehlercode gemeldet werden. Der Fehlercode ist 999 für unbekannte xid
Fehler.
Prozessor- und Speichertaktänderungen in MHz.
Verstoß aufgrund der Leistungsbegrenzung mit Verstoßzeit in ns. (Nur Tesla)
Verstoß aufgrund der thermischen Begrenzung mit boolescher Verletzungsflagge (1/0). (Nur Tesla)
Anmerkungen:
Jede Statistik, der ein „#“ vorangestellt ist, ist ein Kommentar.
Nicht unterstütztes Gerät wird als „#“ angezeigt. , Gerät nicht unterstützt".
Nicht unterstützte Metrik wird als „angezeigt“ , , N/A, N/A".
Verstoß aufgrund von Thermal/Power wird nur für Tesla-basierte Produkte unterstützt. Thermische Verstöße
sind auf Tesla K20 und höher beschränkt.
Topologie (EXPERIMENTAL)
Listen Sie Topologieinformationen zu den GPUs des Systems und deren Verbindung untereinander auf
als qualifizierte NICs, die RDMA unterstützen
Zeigt eine Matrix verfügbarer GPUs mit der folgenden Legende an:
Legende:
X = Selbst
SOC = Pfad durchquert einen Link auf Socket-Ebene (z. B. QPI)
PHB = Pfad überquert eine PCIe-Host-Bridge
PXB = Pfad durchquert mehrere interne PCIe-Switches
PIX = Pfad überquert einen internen PCIe-Switch
EINHEIT ATTRIBUTES
Die folgende Liste beschreibt alle möglichen Daten, die von zurückgegeben werden -q -u Option zur Einheitenabfrage.
Sofern nicht anders angegeben, basieren alle numerischen Ergebnisse auf der Basis 10 und ohne Einheit.
Timestamp
Der aktuelle Systemzeitstempel zum Zeitpunkt des Aufrufs von nvidia-smi. Das Format ist „Wochentag“.
Monat Tag HH:MM:SS Jahr“.
LED Treiber Version
Die Version des installierten NVIDIA-Anzeigetreibers. Format ist
„Major-Number.Minor-Number“.
HIC Info
Informationen zu allen Host-Schnittstellenkarten (HIC), die im System installiert sind.
Firmware Version
Die Version der Firmware, die auf dem HIC ausgeführt wird.
Beigefügt Einheit
Die Anzahl der angeschlossenen Einheiten im System.
Produkt Name
Der offizielle Produktname des Geräts. Dies ist ein alphanumerischer Wert. Für alle S-Klasse
Produkte.
Produkt Id
Die Produktkennung für die Einheit. Dies ist ein alphanumerischer Wert des Formulars
„Teil1-Teil2-Teil3“. Für alle S-Klasse-Produkte.
Produkt Seriell
Der unveränderliche global eindeutige Bezeichner für die Einheit. Dies ist ein alphanumerischer Wert.
Für alle S-Klasse-Produkte.
Firmware Version
Die Version der Firmware, die auf dem Gerät ausgeführt wird. Das Format ist „Major-Number.Minor-Number“.
Für alle S-Klasse-Produkte.
LED Staat
Die LED-Anzeige wird verwendet, um Systeme mit potenziellen Problemen zu kennzeichnen. Eine LED-Farbe von AMBER
weist auf ein Problem hin. Für alle S-Klasse-Produkte.
Farbe Die Farbe der LED-Anzeige. Entweder „GRÜN“ oder „BERNSTEIN“.
Verursachen Der Grund für die aktuelle LED-Farbe. Als Ursache kann eine beliebige aufgeführt werden
Kombination aus „Unbekannt“, „Vom Hostsystem auf AMBER gesetzt“, „Thermosensor“.
„Fehler“, „Lüfterfehler“ und „Temperatur überschreitet kritischen Grenzwert“.
Temperaturen
Temperaturwerte für wichtige Komponenten des Geräts. Alle Messwerte sind in Grad C angegeben.
Möglicherweise sind nicht alle Messwerte verfügbar. Für alle S-Klasse-Produkte.
Aufnahme Lufttemperatur am Geräteeinlass.
Auspuff Lufttemperatur am Auslasspunkt des Geräts.
Board Lufttemperatur auf der gesamten Geräteplatine.
PSU
Messwerte für die Stromversorgung des Geräts. Für alle S-Klasse-Produkte.
Staat Betriebszustand des Netzteils. Der Zustand der Stromversorgung kann einer der folgenden sein:
Folgendes: „Normal“, „Anormal“, „Hohe Spannung“, „Lüfterfehler“, „Kühlkörper“.
Temperatur“, „Stromgrenze“, „Spannung unter UV-Alarmschwelle“,
„Niedrigspannung“, „I2C-Fernausschaltbefehl“, „MOD_DISABLE-Eingang“ oder „Kurzschlussstift“.
Überleitung".
Stromspannung Spannungseinstellung des Netzteils, in Volt.
Aktuell Stromaufnahme des Netzteils, in Ampere.
Ventilator Info
Lüfterwerte für das Gerät. Für jeden Fan ist eine Lektüre vorgesehen, von der es mehrere geben kann
viele. Für alle S-Klasse-Produkte.
Staat Der Zustand des Lüfters, entweder „NORMAL“ oder „FEHLER“.
Schnelligkeit Für einen gesunden Lüfter die Drehzahl des Lüfters in U/min.
Beigefügt GPUs
Eine Liste von PCI-Bus-IDs, die jeder an das Gerät angeschlossenen GPU entsprechen. Der Bus
IDs haben die Form „domain:bus:device.function“ im Hexadezimalformat. Für alle S-Klasse-Produkte.
ANMERKUNG
Unter Linux können NVIDIA-Gerätedateien von nvidia-smi geändert werden, wenn sie als Root ausgeführt werden. Bitte sehen
Lesen Sie den entsprechenden Abschnitt der README-Datei des Treibers.
Die -a und -g Argumente werden jetzt zugunsten von abgelehnt -q und -i, beziehungsweise. Jedoch,
Die alten Argumente funktionieren für diese Version immer noch.
Beispiele:
nvidia-smi -q
Attribute für alle GPUs einmal abfragen und im Klartext auf stdout anzeigen.
nvidia-smi --format=csv,noheader --query-gpu=uuid,persistence_mode
Fragen Sie die UUID und den Persistenzmodus aller GPUs im System ab.
nvidia-smi -q -d ECC, POWER -i 0 -l 10 -f out.log
ECC-Fehler und Stromverbrauch für GPU 0 im Abstand von 10 Sekunden abfragen,
auf unbestimmte Zeit speichern und in der Datei out.log aufzeichnen.
nvidia-smi -c 1 -i GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8
Legen Sie den Rechenmodus für GPU mit UUID auf „EXCLUSIVE_THREAD“ fest
"GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8".
nvidia-smi -q -u -x --dtd
Attribute für alle Einheiten einmal abfragen und im XML-Format mit eingebetteter DTD anzeigen
stdout.
nvidia-smi --dtd -u -f nvsmi_unit.dtd
Schreiben Sie die Unit-DTD in nvsmi_unit.dtd.
nvidia-smi -q -d SUPPORTED_CLOCKS
Unterstützte Uhren aller GPUs anzeigen.
nvidia-smi -i 0 --applications-clocks 2500,745
Stellen Sie den Anwendungstakt auf 2500 MHz Speicher und 745 MHz Grafik ein.
ÄNDERN LOG
=== Bekannte Probleme ===
* Unter Linux kann ein GPU-Reset nicht ausgelöst werden, wenn eine GOM-Änderung aussteht.
* Unter Linux kann es sein, dass das Zurücksetzen der GPU den ausstehenden ECC-Modus nicht erfolgreich ändert. Möglicherweise ist ein vollständiger Neustart erforderlich
erforderlich, um den Moduswechsel zu ermöglichen.
* Im Windows-WDDM-Modus wird der GPU-Speicher von Windows beim Start und dann zugewiesen
direkt verwaltet. Nvidia-smi meldet den genutzten/freien Speicher aus der Sicht des Fahrers, also in
Im WDDM-Modus können die Ergebnisse irreführend sein. Dies wird wahrscheinlich in Zukunft behoben.
=== Änderungen zwischen nvidia-smi v331 Update und v340 ===
* Meldung von Informationen zu Temperaturschwellenwerten hinzugefügt.
* Berichterstattung über Markeninformationen hinzugefügt (z. B. Tesla, Quadro usw.)
* Berichte über Max., Min. und Durchschnitt für Proben hinzugefügt (Leistung, Auslastung, Taktänderungen).
Beispiel-Befehlszeile: nvidia-smi -q -d power,utilization,clock
* Nvidia-smi-Statistikschnittstelle hinzugefügt, um Statistiken wie Leistung, Auslastung,
Uhrumstellungen, XID-Ereignisse und Leistungsbegrenzungszähler mit jeweils einer Zeitangabe
Probe. Beispiel-Befehlszeile: nvidia-smi stats
* Unterstützung für die gemeinsame Berichterstattung von Metriken auf mehr als einer GPU hinzugefügt. Wird mit Komma verwendet
getrennt durch die Option „-i“. Beispiel: nvidia-smi -i 0,1,2
* Unterstützung für die Anzeige der GPU-Encoder- und Decoder-Auslastungen hinzugefügt
* NVIDIA-SMI-Topo-Schnittstelle hinzugefügt, um die GPUDirect-Kommunikationsmatrix anzuzeigen
(EXPERIMENTAL)
* Unterstützung für die Anzeige der GPU-Board-ID und der Angabe, ob es sich um ein MultiGPU-Board handelt oder nicht, wurde hinzugefügt
* Benutzerdefinierter Drosselungsgrund aus der XML-Ausgabe entfernt
=== Änderungen zwischen nvidia-smi v5.319 Update und v331 ===
* Meldung von Nebennummern hinzugefügt.
* Bericht zur BAR1-Speichergröße hinzugefügt.
* Meldung der Bridge-Chip-Firmware hinzugefügt.
=== Änderungen zwischen nvidia-smi v4.319 Production und v4.319 Update ===
* Neuer Schalter --applications-clocks-permission hinzugefügt, um Berechtigungsanforderungen zu ändern
zum Einstellen und Zurücksetzen der Anwendungsuhren.
=== Änderungen zwischen nvidia-smi v4.304 und v4.319 Produktion ===
* Berichte zum Status „Aktiv anzeigen“ hinzugefügt und Dokumentation aktualisiert, um zu verdeutlichen, wie es funktioniert
unterscheidet sich vom Anzeigemodus und dem aktiven Anzeigestatus
* Aus Gründen der Konsistenz auf Multi-GPU-Boards zeigt nvidia-smi -L immer UUID statt an
Seriennummer
* Maschinenlesbare selektive Berichterstattung hinzugefügt. Siehe Abschnitt „SELEKTIVE ABFRAGEOPTIONEN“ von
nvidia-smi -h
* Abfragen für Informationen zur Seiteneinstellung hinzugefügt. Siehe --help-query-retired-pages und -d
PAGE_RETIREMENT
* Der Grund für die Taktdrosselung wurde in „Benutzerdefinierte Uhren“ in „Einstellung für Anwendungsuhren“ umbenannt
* Bei einem Fehler haben Rückkehrcodes für jede Fehlerklasse unterschiedliche Werte ungleich Null. Siehe RÜCKKEHR
Abschnitt VALUE
* nvidia-smi -i kann jetzt Informationen von einer fehlerfreien GPU abfragen, wenn ein Problem auftritt
andere GPU im System
* Alle Meldungen, die auf ein Problem mit einer GPU hinweisen, geben die PCI-Bus-ID einer fehlerhaften GPU aus
* Neues Flag --loop-ms zum Abfragen von Informationen mit höheren Raten als einmal pro Sekunde (can
negative Auswirkungen auf die Systemleistung haben)
* Abfragen für Buchhaltungsprozesse hinzugefügt. Siehe --help-query-accounted-apps und -d
BUCHHALTUNG
* Die erzwungene Leistungsbegrenzung wurde zur Abfrageausgabe hinzugefügt
=== Änderungen zwischen nvidia-smi v4.304 RC und v4.304 Production ===
* Berichte zum GPU-Betriebsmodus (GOM) hinzugefügt
* Neuer Schalter --gom hinzugefügt, um den GPU-Betriebsmodus festzulegen
=== Änderungen zwischen nvidia-smi v3.295 und v4.304 RC ===
* Neuformatierte, nicht ausführliche Ausgabe aufgrund von Benutzerfeedback. Ausstehende Informationen entfernt von
Tabelle.
* Drucken Sie eine hilfreiche Meldung aus, wenn die Initialisierung fehlschlägt, weil das Kernelmodul keinen Empfang hat
unterbricht
* Bessere Fehlerbehandlung, wenn die gemeinsam genutzte NVML-Bibliothek nicht im System vorhanden ist
* Neuer Schalter --applications-clocks hinzugefügt
* Neuer Filter zum Schalter --display hinzugefügt. Mit -d SUPPORTED_CLOCKS ausführen, um die möglichen Optionen aufzulisten
Takte auf einer GPU
* Wenn Sie freien Speicher melden, berechnen Sie ihn aus der gerundeten Gesamtsumme und dem belegten Speicher
dass sich Werte summieren
* Berichte über Einschränkungen der Energieverwaltungsgrenzen und Standardgrenzen hinzugefügt
* Neuer Schalter --power-limit hinzugefügt
* Meldung von Texturspeicher-ECC-Fehlern hinzugefügt
* Meldung der Gründe für die Taktdrosselung hinzugefügt
=== Änderungen zwischen nvidia-smi v2.285 und v3.295 ===
* Klarere Fehlerberichte für ausgeführte Befehle (z. B. Ändern des Rechenmodus)
* Beim gleichzeitigen Ausführen von Befehlen auf mehreren GPUs werden N/A-Fehler als Warnungen behandelt.
* nvidia-smi -i unterstützt jetzt auch UUID
* Das UUID-Format wurde an den UUID-Standard angepasst und meldet einen anderen Wert.
=== Änderungen zwischen nvidia-smi v2.0 und v2.285 ===
* VBIOS-Version melden.
* Flag -d/--display hinzugefügt, um Teile von Daten zu filtern
* Bericht zur PCI-Subsystem-ID hinzugefügt
* Aktualisierte Dokumente, um anzugeben, dass wir M2075 und C2075 unterstützen
* Melden Sie die HIC-HWBC-Firmware-Version mit dem Schalter -u
* Max(P0)-Uhren neben den aktuellen Uhren melden
* Flag --dtd hinzugefügt, um die Geräte- oder Einheiten-DTD zu drucken
* Meldung hinzugefügt, wenn der NVIDIA-Treiber nicht ausgeführt wird
* Berichte über PCIe-Link-Generierung (maximal und aktuell) und Linkbreite (maximal und aktuell) hinzugefügt
aktuell).
* Das Abrufen des ausstehenden Treibermodells funktioniert auch ohne Administratorrechte
* Unterstützung für die Ausführung von nvidia-smi auf Windows-Gastkonten hinzugefügt
* Wenn Sie nvidia-smi ohne den Befehl -q ausführen, wird stattdessen eine nicht ausführliche Version von -q ausgegeben
Hilfe
* Das Parsen des Arguments -l/--loop= wurde korrigiert (Standardwert 0 bis großer Wert).
* Format der pciBusId geändert (zu XXXX:XX:XX.X – diese Änderung war in 280 sichtbar)
* Das Parsen der Bus-ID für den Befehl -i ist weniger restriktiv. Sie können 0:2:0.0 oder passieren
0000:02:00 und andere Variationen
* Versionsschema geändert, um auch „Treiberversion“ einzuschließen.
* Das XML-Format entspricht immer der DTD, auch wenn Fehlerbedingungen auftreten
* Unterstützung für Einzel- und Doppelbit-ECC-Ereignisse und XID-Fehler hinzugefügt (standardmäßig aktiviert).
mit deaktiviertem Flag -l für Flag -x)
* Geräte-Reset-Flags -r --gpu-reset hinzugefügt
* Liste der laufenden Rechenprozesse hinzugefügt
* Energiestatus in Leistungsstatus umbenannt. In der XML-Ausgabe gibt es veraltete Unterstützung
nur.
* Die DTD-Versionsnummer wurde auf 2.0 aktualisiert, um der aktualisierten XML-Ausgabe zu entsprechen
Verwenden Sie alt-nvidia-340-smi online über die Dienste von onworks.net