EnglischFranzösischSpanisch

Ad


OnWorks-Favicon

sge_ckpt – Online in der Cloud

Führen Sie sge_ckpt im kostenlosen Hosting-Anbieter OnWorks über Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator aus

Dies ist der Befehl sge_ckpt, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


sge_ckpt.1 – der Checkpointing-Mechanismus und die Checkpointing-Unterstützung der Sun Grid Engine

BESCHREIBUNG


Sun Grid Engine unterstützt zwei Prüfpunktebenen: die Benutzerebene und eine Betriebsebene
System bereitgestellt transparente Ebene. Checkpointing auf Benutzerebene bezieht sich auf Anwendungen, die
Führen Sie ihr eigenes Checkpointing durch, indem Sie zu bestimmten Zeiten Neustartdateien oder algorithmische Schritte schreiben
und durch die ordnungsgemäße Verarbeitung dieser Neustartdateien beim Neustart.

Transparentes Checkpointing muss vom Betriebssystem bereitgestellt werden und ist in der Regel auch so
in den Betriebssystemkern integriert. Ein Beispiel für einen integrierten Kernel
Checkpointing-Funktion ist das Hibernator-Paket von Softway für SGI IRIX-Plattformen.

Checkpointing-Jobs müssen dem Sun Grid Engine-System mithilfe von identifiziert werden -ckpt
Option der qsub1() Befehl. Das Argument zu diesem Flag bezieht sich auf ein sogenanntes
Checkpointing-Umgebung, die die Attribute der zu verwendenden Checkpointing-Methode definiert
gebraucht (siehe Checkpoint5() für Details). Checkpointing-Umgebungen werden von eingerichtet
qconf1() Optionen -akpt, -dckpt, -mckpt und -sckptdem „Vermischten Geschmack“. Seine qsub1() Möglichkeit -c kann benutzt werden um
überschreibe die wann Attribut für die referenzierte Prüfpunktumgebung.

Wenn eine Warteschlange vom Typ CHECKPOINTING ist, müssen Jobs über das Checkpointing-Attribut verfügen
markiert (siehe die -ckpt Option zu qsub1()) darf in einer solchen Warteschlange ausgeführt werden. Als
Im Gegensatz zum Verhalten bei regulären Batch-Jobs werden Checkpointing-Jobs unter abgebrochen
Bedingungen, bei denen Batch- oder interaktive Jobs ausgesetzt werden oder sogar davon unberührt bleiben.
Diese Bedingungen sind:

· Explizite Unterbrechung der Warteschlange oder des Jobs über qmod1() durch die Clusterverwaltung oder a
Warteschlangenbesitzer, wenn der x Anlassspezifizierer (siehe qsub1() -c und Checkpoint5()) wurde beauftragt
zum Beruf.

· Ein Lastdurchschnittswert, der den für den konfigurierten Suspend-Schwellenwert überschreitet
entsprechenden Warteschlangen (siehe queue_conf5().)

· Herunterfahren des Sun Grid Engine-Ausführungsdämons sge_execd8() verantwortlich für die
Checkpointing-Job.

Nach dem Abbruch werden die Jobs in andere Warteschlangen migriert, es sei denn, sie wurden an eine weitergeleitet
bestimmte Warteschlange durch eine explizite Benutzeranforderung. Die Migration von Arbeitsplätzen führt zu einer dynamischen Belastung
balancieren. Hinweis: Durch den Abbruch von Checkpoint-Jobs werden alle Ressourcen (Speicher, Swap) freigegeben
Platz), den der Job zu diesem Zeitpunkt einnimmt. Dies steht im Gegensatz zur Situation für suspendierte Personen
reguläre Jobs, die immer noch den Swap-Bereich abdecken.

RESTRICTIONS


Wenn ein Job in eine Warteschlange auf einem anderen Computer migriert wird, werden derzeit keine Dateien übertragen
automatisch auf diese Maschine übertragen. Dies bedeutet, dass alle Dateien, die im gesamten System verwendet werden
Der gesamte Job einschließlich Neustartdateien, ausführbaren Dateien und Arbeitsdateien muss sichtbar sein oder
explizit (z. B. am Anfang des Jobskripts) übertragen werden.

Es gibt auch einige praktische Einschränkungen hinsichtlich der Nutzung des Speicherplatzes für Transparent
Checkpointing-Jobs. Prüfpunkte einer transparenten Prüfpunktanwendung sind normalerweise
Wird vom Betriebssystem in einer Prüfpunktdatei oder einem Prüfpunktverzeichnis gespeichert. Die Datei oder das Verzeichnis
enthält den gesamten Text, die Daten und den Stapelspeicher für den Prozess sowie einige zusätzliche
Kontrollinformationen. Dies bedeutet, dass Jobs einen sehr großen virtuellen Adressraum verwenden
Generieren Sie sehr große Checkpoint-Dateien. Auch die Arbeitsplätze, auf denen die Jobs ausgeführt werden
Bei der tatsächlichen Ausführung ist möglicherweise nur wenig freier Speicherplatz verfügbar. Daher ist dies nicht immer möglich
Übertragen Sie einen transparenten Prüfpunktauftrag an eine Maschine, auch wenn diese Maschine inaktiv ist.
Da große virtuelle Speicherjobs auf eine Maschine warten müssen, die sowohl im Leerlauf ist als auch über eine verfügt
Wenn genügend freier Speicherplatz vorhanden ist, kann es bei solchen Aufträgen zu langen Bearbeitungszeiten kommen.

Verwenden Sie sge_ckpt online über die Dienste von onworks.net


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad