GoGPT Best VPN GoSearch

OnWorks-Favicon

sdiag - Online in der Cloud

Führen Sie sdiag im kostenlosen Hosting-Anbieter OnWorks über Ubuntu Online, Fedora Online, Windows Online-Emulator oder MAC OS Online-Emulator aus

Dies ist der Befehl sdiag, der im kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, Windows Online-Emulator oder MAC OS Online-Emulator ausgeführt werden kann.

PROGRAMM:

NAME/FUNKTION


sdiag – Planungsdiagnosetool für Slurm

ZUSAMMENFASSUNG


sdiag

BESCHREIBUNG


sdiag zeigt Informationen zur slurmctld-Ausführung über: Threads, Agenten, Jobs und
Scheduling-Algorithmen. Ziel ist es, Daten aus dem Verhalten von slurmctld zu gewinnen, die helfen,
Konfigurationsparameter oder Warteschlangenrichtlinien anpassen. Der Hauptgrund dafür ist zu wissen
Slurm-Verhalten unter Systemen mit hohem Durchsatz.

Es gibt zwei Ausführungsmodi. Der Standardmodus --alle zeigt mehrere Zähler und Statistiken
später erklärt, und es gibt eine weitere Ausführungsoption --zurücksetzen zum Zurücksetzen dieser Werte.

Die Werte werden standardmäßig um Mitternacht (UTC) zurückgesetzt.

Der erste Informationsblock bezieht sich auf die globale Ausführung von slurmctld:

Server Faden zählen
Die Anzahl der aktuell aktiven slurmctld-Threads. Eine hohe Zahl würde eine hohe
Lastverarbeitungsereignisse wie Auftragsübermittlungen, Auftragsversendungen, Auftragsabschlüsse,
usw. Wenn dieser Wert oft in der Nähe von MAX_SERVER_THREADS liegt, könnte dies auf ein potenzielles
Engpass.

Makler Warteschlange Größe
Das Slurm-Design ist auf Skalierbarkeit ausgelegt und das Senden von Nachrichten an Tausende von Knoten ist
keine triviale Aufgabe. Der Agentenmechanismus hilft, die Kommunikation zwischen den
Slurm-Daemons und der Controller für eine bestmögliche Leistung. Wenn dieser Wert nahe an
MAX_AGENT_CNT: Es kann zu Verzögerungen bei der Auftragsverwaltung kommen.

Jobs eingereicht
Anzahl der seit dem letzten Zurücksetzen übermittelten Jobs

Jobs begonnen
Anzahl der seit dem letzten Zurücksetzen gestarteten Jobs. Dies schließt nachgefüllte Jobs ein.

Jobs fertiggestellt
Anzahl der seit dem letzten Zurücksetzen abgeschlossenen Jobs.

Jobs abgebrochen
Anzahl der seit dem letzten Zurücksetzen abgebrochenen Jobs.

Jobs gescheitert
Anzahl der fehlgeschlagenen Jobs seit dem letzten Zurücksetzen.

Der zweite Informationsblock bezieht sich auf den Hauptplanungsalgorithmus basierend auf Jobs
Prioritäten. Ein Scheduling-Zyklus impliziert, die Sperre job_write_lock zu erhalten, dann zu versuchen,
Ressourcen für ausstehende Jobs, beginnend mit dem Job mit der höchsten Priorität und absteigend
Reihenfolge. Sobald ein Job die Ressourcen nicht erhalten kann, läuft die Schleife weiter, aber nur für Jobs
andere Partitionen anfordern. Jobs mit Abhängigkeiten oder von Kontenlimits betroffen sind
nicht verarbeitet.

Nachname Zyklus
Zeit in Mikrosekunden für den letzten Planungszyklus.

Max Zyklus
Zeit in Mikrosekunden für den maximalen Planungszyklus seit dem letzten Zurücksetzen.

Total Zyklen
Anzahl der Planungszyklen seit dem letzten Zurücksetzen. Die Planung erfolgt in regelmäßigen
und wenn ein Auftrag übermittelt oder abgeschlossen wird.

Bedeuten Zyklus
Durchschnitt der Planungszyklen seit dem letzten Zurücksetzen

Bedeuten Tiefe Zyklus
Durchschnittliche Zyklustiefe. Tiefe bedeutet Anzahl der in einem Planungszyklus verarbeiteten Jobs.

Fahrräder für Minute
Zähler der Planungsausführungen pro Minute

Nachname Warteschlange Länge
Länge der Warteschlange für ausstehende Aufträge.

Der dritte Informationsblock bezieht sich auf den Backfilling-Planungsalgorithmus.
Der Backfilling-Planungszyklus impliziert das Abrufen von Sperren für Jobs, Knoten und Partitionsobjekte
Anschließend wird versucht, Ressourcen für ausstehende Jobs zu erhalten. Jobs werden basierend auf Prioritäten verarbeitet. Wenn
Ein Job kann keine Ressourcen erhalten, der Algorithmus berechnet, wann er sie erhalten könnte, um eine
zukünftige Startzeit für den Job. Dann wird der nächste Job verarbeitet und der Algorithmus versucht,
Ressourcen für diesen Job, aber vermeiden, die früher Einsen, und wieder berechnet es
die zukünftige Startzeit, wenn keine aktuellen Ressourcen verfügbar sind. Der Backfilling-Algorithmus nimmt
mehr Zeit für die Verarbeitung jedes neuen Jobs, da Jobs mit höherer Priorität nicht beeinflusst werden können. Die
Der Algorithmus selbst ergreift Maßnahmen, um einen langen Ausführungszyklus zu vermeiden und alle
Sperren zu lange.

Total verfüllt Jobs & Karriere (schon seit letzte schlummern Anfang)
Anzahl der seit dem letzten Slurm-Start dank Backfilling gestarteten Jobs.

Total verfüllt Jobs & Karriere (schon seit letzte Statistik Zyklus Anfang)
Anzahl der Jobs, die seit dem letzten Zurücksetzen der Statistiken durch Backfilling gestartet wurden. Von
Standardmäßig werden diese Werte um Mitternacht UTC-Zeit zurückgesetzt.

Total Zyklen
Anzahl der Planungszyklen seit dem letzten Zurücksetzen

Nachname Zyklus wann
Uhrzeit des letzten Ausführungszyklus im Format „Wochentag, Monat, Monat, Tag“
Stunde:Minute.Sekunden Jahr"

Nachname Zyklus
Zeit in Mikrosekunden des letzten Backfilling-Zyklus. Es zählt nur die Ausführungszeit
Entfernen der Ruhezeit innerhalb eines Planungszyklus, wenn dies zu lange dauert. Hinweis
dass Sperren während der Ruhezeit aufgehoben werden, damit andere Arbeiten fortgesetzt werden können.

Max Zyklus
Zeit in Mikrosekunden der maximalen Ausführung des Rückfüllzyklus seit dem letzten Zurücksetzen.
zählt nur die Ausführungszeit und entfernt die Ruhezeit innerhalb eines Planungszyklus, wenn
dauert zu lange. Beachten Sie, dass Sperren während der Ruhezeit freigegeben werden, so dass
andere Arbeiten können fortgesetzt werden.

Bedeuten Zyklus
Durchschnitt der Backfilling-Planungszyklen in Mikrosekunden seit dem letzten Zurücksetzen

Nachname Tiefe Zyklus
Anzahl der verarbeiteten Jobs während des letzten Backfilling-Planungszyklus. Es zählt jeden
Prozess, auch wenn er aufgrund von Abhängigkeiten oder Beschränkungen nicht ausgeführt werden kann.

Nachname Tiefe Zyklus (Versuchen Zeitplan)
Anzahl der verarbeiteten Jobs während des letzten Backfilling-Planungszyklus. Es zählt nur
Prozesse mit der Möglichkeit, auf verfügbare Ressourcen zu warten. Diese Jobs sind
was den Backfilling-Algorithmus schwerer macht.

Tiefe Bedeuten
Durchschnitt der verarbeiteten Jobs während der Backfilling-Planungszyklen seit dem letzten Zurücksetzen.

Tiefe Bedeuten (Versuchen Zeitplan)
Durchschnitt der verarbeiteten Jobs während der Backfilling-Planungszyklen seit dem letzten Reset. Es
zählt nur Prozesse, die möglicherweise ausgeführt werden und auf verfügbare Ressourcen warten. Diese
Jobs sind, was den Backfilling-Algorithmus schwerer macht.

Nachname Warteschlange Länge
Anzahl der Jobs, die vom Backfilling-Algorithmus verarbeitet werden müssen. Ein Job wird als
so oft wie die angeforderten Partitionen.

Warteschlange Länge Bedeuten
Durchschnitt der Jobs, die noch vom Backfilling-Algorithmus verarbeitet werden müssen.

Der vierte und fünfte Informationsblock geben die am häufigsten ausgegebenen Remote-
Prozeduraufrufe (RPCs), Aufrufe an den Slurmctld-Daemon, um eine Aktion auszuführen. Die
Der vierte Block meldet die RPCs, die nach Nachrichtentyp ausgegeben wurden. Sie müssen diese RPCs nachschlagen
Codes im Slurm-Quellcode, indem Sie sie in der Datei nachschlagen
src/common/slurm_protocol_defs.h. Der Bericht enthält die Anzahl der Male, die jeder RPC
aufgerufen, die Gesamtzeit, die von allen diesen RPCs verbraucht wird, plus die durchschnittliche Zeit, die von
jeder RPC in Mikrosekunden. Der fünfte Block meldet die RPCs, die nach Benutzer-ID ausgegeben wurden, die Gesamtzahl
Anzahl der RPCs, die sie ausgegeben haben, die Gesamtzeit, die von allen diesen RPCs verbraucht wurde, plus die
durchschnittliche Zeit, die jeder RPC in Mikrosekunden benötigt.

OPTIONAL


-a, --alle
Informationen abrufen und melden. Dies ist der Standardbetriebsmodus.

-h, --help
Beschreibung der Optionen drucken und beenden.

-i, --sort-by-id
Sortieren Sie Remote Procedure Call (RPC)-Daten nach Nachrichtentyp-ID und Benutzer-ID.

-r, --zurücksetzen
Zähler zurücksetzen. Wird nur für Slurm-Betreiber und -Administratoren unterstützt.

-t, --sort-by-time
Sortieren Sie Remote Procedure Call (RPC)-Daten nach der Gesamtlaufzeit.

-T, --sort-by-time2
Sortieren Sie Remote Procedure Call (RPC)-Daten nach durchschnittlicher Laufzeit.

--Verwendungszweck
Liste der Optionen drucken und beenden.

-V, --Version
Aktuelle Versionsnummer ausgeben und beenden.

VARIABLEN


Manche sdiag Optionen können über Umgebungsvariablen gesetzt werden. Diese Umgebungsvariablen,
zusammen mit den entsprechenden Optionen sind unten aufgeführt. (Hinweis: Befehlszeilenoptionen werden
diese Einstellungen immer überschreiben)

SLURM_CONF Der Speicherort der Slurm-Konfigurationsdatei.

KOPIEREN


Copyright (C) 2010-2011 Barcelona Supercomputing Center.
Copyright (C) 2010-2014 SchedMD LLC.

Slurm ist freie Software; Sie können es unter den Bedingungen der weitergeben und/oder ändern
GNU General Public License, wie von der Free Software Foundation veröffentlicht; entweder Version 2
der Lizenz oder (nach Ihrer Wahl) einer späteren Version.

Slurm wird in der Hoffnung verteilt, dass es nützlich sein wird, jedoch OHNE JEGLICHE GEWÄHRLEISTUNG; ohne
sogar die stillschweigende Garantie der MARKTFÄHIGKEIT oder EIGNUNG FÜR EINEN BESTIMMTEN ZWECK. Siehe die
GNU General Public License für weitere Details.

Verwenden Sie sdiag online mit den Diensten von onworks.net


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad




×
Werbung
❤ ️Hier einkaufen, buchen oder kaufen – kostenlos, damit die Dienste kostenlos bleiben.