Jest to polecenie sge_ckpt, które można uruchomić w darmowym dostawcy usług hostingowych OnWorks przy użyciu jednej z wielu naszych bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online MAC OS
PROGRAM:
IMIĘ
sge_ckpt.1 — mechanizm punktów kontrolnych Sun Grid Engine i obsługa punktów kontrolnych
OPIS
Sun Grid Engine obsługuje dwa poziomy punktów kontrolnych: poziom użytkownika i poziom operacyjny
system zapewniał przejrzysty poziom. Punkty kontrolne na poziomie użytkownika odnoszą się do aplikacji, które
wykonują własne punkty kontrolne, zapisując pliki restartu w określonych momentach lub krokach algorytmicznych
oraz przez prawidłowe przetwarzanie tych plików restartu po ponownym uruchomieniu.
Przejrzyste punkty kontrolne muszą być zapewniane przez system operacyjny i zwykle są
zintegrowane z jądrem systemu operacyjnego. Przykład zintegrowanego jądra
punktem kontrolnym jest pakiet Hibernator firmy Softway dla platform SGI IRIX.
Zadania punktów kontrolnych należy zidentyfikować w systemie Sun Grid Engine za pomocą pliku -ckpt
opcja qsub1() Komenda. Argument tej flagi odnosi się do tzw
środowisko punktów kontrolnych, które definiuje atrybuty metody punktów kontrolnych
używany (patrz punkt kontrolny5() dla szczegółów). Środowiska punktów kontrolnych są konfigurowane przez
qconf1() opcje -zaakceptuj, -dckpt, -mckpt i -skpt, qsub1() opcja -c mogą być stosowane w celu
nadpisz jeśli chodzi o komunikację i motywację atrybut dla przywoływanego środowiska punktów kontrolnych.
Jeśli kolejka jest typu CHECKPOINTING, zadania muszą mieć atrybut checkpointing
oznaczone (zob -ckpt opcja do qsub1()), aby móc uruchomić się w takiej kolejce. Jak
w przeciwieństwie do zachowania w przypadku zwykłych zadań wsadowych, zadania punktów kontrolnych są przerywane
warunków, w przypadku których zadania wsadowe lub zadania interaktywne są zawieszane lub nawet pozostają nienaruszone.
Te warunki to:
· Wyraźne zawieszenie kolejki lub zadania za pośrednictwem qmod1() przez administrację klastra lub a
właściciel kolejki, jeśli x specyfikator okazji (zob qsub1() -c i punkt kontrolny5()) został przydzielony
do pracy.
· Średnia wartość obciążenia przekraczająca próg zawieszenia skonfigurowany dla
odpowiednie kolejki (zob kolejka_konf5().)
· Wyłączenie demona wykonawczego Sun Grid Engine sge_execd8() będąc odpowiedzialnym za
praca w punkcie kontrolnym.
Po przerwaniu zadania zostaną przeniesione do innych kolejek, chyba że zostały przesłane do jednej
określoną kolejkę na wyraźne żądanie użytkownika. Migracja miejsc pracy prowadzi do dynamicznego obciążenia
balansowy. Uwaga: Aborcja zadań z punktami kontrolnymi zwolni wszystkie zasoby (pamięć, swap
miejsca), które w tym czasie zajmuje praca. Jest to sprzeczne z sytuacją zawieszoną
regularne prace, które nadal obejmują przestrzeń wymiany.
OGRANICZENIA
Kiedy zadanie migruje do kolejki na innym komputerze, obecnie żadne pliki nie są przesyłane
automatycznie do tej maszyny. Oznacza to, że wszystkie pliki, które są używane w całym
całe zadanie, w tym pliki restartu, pliki wykonywalne i pliki tymczasowe, muszą być widoczne lub
przeniesione jawnie (np. na początku skryptu pracy).
Istnieją również pewne praktyczne ograniczenia dotyczące wykorzystania miejsca na dysku w celu przeźroczystości
zadania związane z punktami kontrolnymi. Punkty kontrolne aplikacji z przejrzystymi punktami kontrolnymi są zwykle
przechowywane w pliku punktu kontrolnego lub katalogu przez system operacyjny. Plik lub katalog
zawiera cały tekst, dane i miejsce na stosie dla procesu, wraz z pewnymi dodatkowymi
informacje kontrolne. Oznacza to, że zadania korzystające z bardzo dużej wirtualnej przestrzeni adresowej będą
generować bardzo duże pliki punktów kontrolnych. Również stacje robocze, na których będą wykonywane zadania
faktycznie wykonywane mogą mieć mało wolnego miejsca na dysku. Dlatego nie zawsze jest to możliwe
przenieś zadanie przezroczystego punktu kontrolnego do maszyny, nawet jeśli ta maszyna jest bezczynna.
Ponieważ duże zadania pamięci wirtualnej muszą czekać na maszynę, która jest zarówno bezczynna, jak i ma
wystarczającej ilości wolnego miejsca na dysku, takie zadania mogą mieć długi czas realizacji.
Korzystaj z usługi sge_ckpt online, korzystając z usług onworks.net