Dit is de opdracht sge_ckpt die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator
PROGRAMMA:
NAAM
sge_ckpt.1 - het controlepuntmechanisme en ondersteuning voor controlepunten van de Sun Grid Engine
PRODUCTBESCHRIJVING
Sun Grid Engine ondersteunt twee controleniveaus: het gebruikersniveau en een operationeel niveau
systeem verstrekt transparant niveau. Controlepunten op gebruikersniveau verwijzen naar toepassingen die
hun eigen controlepunten uitvoeren door op bepaalde tijdstippen of algoritmische stappen herstartbestanden te schrijven
en door deze herstartbestanden op de juiste manier te verwerken wanneer ze opnieuw worden opgestart.
Transparante controlepunten moeten door het besturingssysteem worden geleverd en zijn dat meestal ook
geïntegreerd in de kernel van het besturingssysteem. Een voorbeeld voor een geïntegreerde kernel
checkpointing-faciliteit is het Hibernator-pakket van Softway voor SGI IRIX-platforms.
Controlepunttaken moeten worden geïdentificeerd aan het Sun Grid Engine-systeem met behulp van de -ckpt
optie van de qsub1() opdracht. Het argument bij deze vlag verwijst naar een zogenaamde
controlepuntomgeving, die de attributen van de controlepuntmethode definieert
gebruikt (zie ijkpunt5() voor details). Controlepuntomgevingen worden opgezet door de
qconf1() opties -accepteren, -dckpt, -mckpt en -scpt. De qsub1() keuze -c kan worden gebruikt
overschrijf de wanneer attribuut voor de controlepuntomgeving waarnaar wordt verwezen.
Als een wachtrij van het type CHECKPOINTING is, moeten taken het kenmerk checkpointing hebben
gemarkeerd (zie de -ckpt optie om qsub1()) om in een dergelijke wachtrij te mogen draaien. Als
In tegenstelling tot het gedrag bij reguliere batchtaken, worden controlepunttaken afgebroken onder
omstandigheden, waarvoor batch- of interactieve opdrachten worden opgeschort of zelfs onaangetast blijven.
Deze voorwaarden zijn:
· Expliciete opschorting van de wachtrij of taak via qmod1() door het clusterbeheer of a
wachtrij-eigenaar als de x gelegenheidsspecificatie (zie qsub1() -c en ijkpunt5()) kreeg toegewezen
naar de baan.
· Een gemiddelde belastingwaarde die de onderbrekingsdrempel overschrijdt zoals geconfigureerd voor de
overeenkomstige wachtrijen (zie wachtrij_conf5().)
· Afsluiten van de uitvoeringsdaemon van de Sun Grid Engine sge_execd8() verantwoordelijk zijn voor de
controlepunt taak.
Na de abortus migreren de taken naar andere wachtrijen, tenzij ze naar een wachtrij zijn verzonden
specifieke wachtrij door een expliciet gebruikersverzoek. De migratie van banen leidt tot een dynamische belasting
balanceren. Opmerking: Het aborteren van gecheckpointeerde banen zal alle bronnen (geheugen, swap) vrijmaken
ruimte) die de baan op dat moment in beslag neemt. Dit is in strijd met de situatie voor geschorst
reguliere banen, die nog steeds ruilruimte in beslag nemen.
BEPERKINGEN
Wanneer een taak naar een wachtrij op een andere machine migreert, worden er momenteel geen bestanden overgedragen
automatisch naar die machine. Dit betekent dat alle bestanden die in de hele
de gehele taak inclusief herstartbestanden, uitvoerbare bestanden en scratch-bestanden moeten zichtbaar zijn of
expliciet overgedragen (bijvoorbeeld aan het begin van het taakscript).
Er zijn ook enkele praktische beperkingen met betrekking tot het gebruik van schijfruimte voor transparant
controlepunt banen. Controlepunten van een transparant gecontroleerde applicatie zijn dat meestal
opgeslagen in een controlepuntbestand of map door het besturingssysteem. Het bestand of de map
bevat alle tekst, gegevens en stapelruimte voor het proces, samen met wat extra
controle informatie. Dit betekent dat banen die een zeer grote virtuele adresruimte gebruiken, dat wel zullen doen
zeer grote controlepuntbestanden genereren. Ook de werkstations waarop de banen komen te staan
daadwerkelijk uitvoeren heeft mogelijk weinig vrije schijfruimte. Het is dus niet altijd mogelijk
een transparante controlepunttaak overbrengen naar een machine, ook al is die machine niet actief.
Omdat grote virtuele geheugentaken moeten wachten op een machine die zowel inactief is als een
Als er voldoende vrije schijfruimte is, kunnen dergelijke taken een lange doorlooptijd hebben.
Gebruik sge_ckpt online met behulp van onworks.net-services