Ito ang command na sge_ckpt na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
sge_ckpt.1 - ang mekanismo ng checkpointing ng Sun Grid Engine at suporta sa checkpointing
DESCRIPTION
Sinusuportahan ng Sun Grid Engine ang dalawang antas ng checkpointing: ang antas ng user at isang operating
system na ibinigay transparent na antas. Ang checkpointing sa antas ng user ay tumutukoy sa mga application, na
gawin ang kanilang sariling checkpointing sa pamamagitan ng pagsulat ng mga restart file sa ilang partikular na oras o algorithmic na mga hakbang
at sa pamamagitan ng maayos na pagproseso ng mga restart na file na ito kapag na-restart.
Ang transparent na checkpointing ay kailangang ibigay ng operating system at karaniwan ay
isinama sa kernel ng operating system. Isang halimbawa para sa isang kernel integrated
Ang checkpointing facility ay ang Hibernator package mula sa Softway para sa mga platform ng SGI IRIX.
Ang mga trabaho sa checkpointing ay kailangang matukoy sa sistema ng Sun Grid Engine sa pamamagitan ng paggamit ng -ckpt
opsyon ng qsub1() utos. Ang argumento sa watawat na ito ay tumutukoy sa isang tinatawag na
checkpointing environment, na tumutukoy sa mga katangian ng paraan ng checkpointing
ginamit (tingnan checkpoint5() para sa mga detalye). Ang mga checkpointing environment ay ise-setup ng
qconf1() mga pagpipilian -ackpt, -dckpt, -mckpt at -sckpt. ang qsub1() opsyon -c ay maaaring magamit upang
patungan ang kailan attribute para sa reference na checkpointing environment.
Kung ang isang queue ay nasa uri ng CHECKPOINTING, ang mga trabaho ay kailangang magkaroon ng checkpointing attribute
na-flag (tingnan ang -ckpt pagpipilian sa qsub1()) na payagang tumakbo sa naturang pila. Bilang
salungat sa pag-uugali para sa mga regular na batch na trabaho, ang mga checkpointing job ay inaabort sa ilalim
mga kundisyon, kung saan ang mga batch o interactive na trabaho ay nasuspinde o mananatiling hindi naaapektuhan.
Ang mga kondisyong ito ay:
· Tahasang pagsususpinde ng pila o trabaho sa pamamagitan ng qmod1() ng cluster administration o a
may-ari ng pila kung ang x tagapagpahiwatig ng okasyon (tingnan qsub1() -c at checkpoint5()) ay itinalaga
sa trabaho.
· Isang average na halaga ng pag-load na lumampas sa limitasyon ng pagsususpinde gaya ng na-configure para sa
kaukulang mga pila (tingnan queue_conf5().)
· Pag-shutdown ng Sun Grid Engine execution daemon sge_execd8() pagiging responsable para sa
trabaho sa checkpointing.
Pagkatapos ng pagpapalaglag, ang mga trabaho ay lilipat sa iba pang mga pila maliban kung sila ay isinumite sa isa
tiyak na pila sa pamamagitan ng isang tahasang kahilingan ng user. Ang paglipat ng mga trabaho ay humahantong sa isang dynamic na pagkarga
pagbabalanse. tandaan: Ang pagpapalaglag ng mga naka-checkpoint na trabaho ay magpapalaya sa lahat ng mapagkukunan (memorya, swap
space) na sinasakop ng trabaho sa panahong iyon. Tutol ito sa sitwasyon para sa suspendido
mga regular na trabaho, na sumasaklaw pa rin sa swap space.
RESTRICTIONS
Kapag ang isang trabaho ay lumipat sa isang pila sa isa pang makina sa kasalukuyan, walang mga file na inililipat
awtomatiko sa makina na iyon. Nangangahulugan ito na ang lahat ng mga file na ginagamit sa buong
buong trabaho kasama ang mga restart file, executable at scratch file ay dapat na nakikita o
tahasang inilipat (hal. sa simula ng script ng trabaho).
Mayroon ding ilang mga praktikal na limitasyon tungkol sa paggamit ng puwang sa disk para sa transparent
mga trabaho sa checkpointing. Karaniwan ang mga checkpoint ng isang transparent na checkpointed application
na naka-imbak sa isang checkpoint file o direktoryo ng operating system. Ang file o direktoryo
naglalaman ng lahat ng text, data, at stack space para sa proseso, kasama ang ilang karagdagang
kontrolin ang impormasyon. Nangangahulugan ito ng mga trabahong gumagamit ng napakalaking virtual address space
bumuo ng napakalaking checkpoint file. Gayundin ang mga workstation kung saan gagawin ang mga trabaho
ang aktwal na execute ay maaaring may kaunting libreng puwang sa disk. Kaya hindi laging posible
ilipat ang isang transparent na checkpointing job sa isang makina, kahit na ang makinang iyon ay idle.
Dahil ang malalaking virtual memory na trabaho ay dapat maghintay para sa isang makina na parehong idle, at may a
sapat na dami ng libreng puwang sa disk, ang mga naturang trabaho ay maaaring magdusa ng mahabang panahon ng turnaround.
Gamitin ang sge_ckpt online gamit ang mga serbisyo ng onworks.net