Ini ialah arahan sge_ckpt yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.
JADUAL:
NAMA
sge_ckpt.1 - mekanisme pemeriksaan dan sokongan pusat pemeriksaan Sun Grid Engine
DESCRIPTION
Enjin Sun Grid menyokong dua peringkat pemeriksaan: tahap pengguna dan operasi
sistem yang disediakan tahap telus. Semakan peringkat pengguna merujuk kepada aplikasi, yang
lakukan pemeriksaan mereka sendiri dengan menulis fail mulakan semula pada masa tertentu atau langkah algoritma
dan dengan memproses fail mulakan semula ini dengan betul apabila dimulakan semula.
Pemeriksaan telus perlu disediakan oleh sistem pengendalian dan biasanya
disepadukan dalam kernel sistem pengendalian. Contoh untuk kernel bersepadu
kemudahan pemeriksaan adalah pakej Hibernator dari Softway untuk platform SGI IRIX.
Kerja checkpointing perlu dikenal pasti kepada sistem Sun Grid Engine dengan menggunakan -ckpt
pilihan untuk qsub1() perintah. Hujah untuk bendera ini merujuk kepada apa yang dipanggil
persekitaran checkpointing, yang mentakrifkan atribut kaedah checkpointing
digunakan (lihat pusat pemeriksaan5() untuk butiran). Persekitaran pusat pemeriksaan disediakan oleh
qconf1() pilihan -ackpt, -dckpt, -mckpt and -sckpt. Yang qsub1() pilihan -c boleh digunakan untuk
tulis ganti apabila atribut untuk persekitaran titik semak yang dirujuk.
Jika baris gilir adalah daripada jenis CHECKPOINTING, kerja perlu mempunyai atribut checkpointing
dibenderakan (lihat -ckpt pilihan untuk qsub1()) untuk dibenarkan berjalan dalam barisan sedemikian. Sebagai
bertentangan dengan tingkah laku untuk kerja kelompok biasa, kerja pusat pemeriksaan digugurkan di bawah
syarat, yang mana kumpulan atau kerja interaktif digantung atau malah kekal tidak terjejas.
Syarat-syarat ini ialah:
· Penggantungan eksplisit baris gilir atau kerja melalui qmod1() oleh pentadbiran kluster atau a
pemilik beratur jika x penentu majlis (lihat qsub1() -c and pusat pemeriksaan5()) telah ditugaskan
kepada pekerjaan itu.
· Nilai purata beban melebihi ambang penggantungan seperti yang dikonfigurasikan untuk
baris gilir yang sepadan (lihat queue_conf5().)
· Penutupan daemon pelaksanaan Enjin Grid Matahari sge_execd8() bertanggungjawab ke atas
kerja checkpoint.
Selepas pengguguran, pekerjaan akan berpindah ke baris gilir lain melainkan mereka diserahkan kepada satu baris gilir
baris gilir khusus oleh permintaan pengguna yang jelas. Perpindahan pekerjaan membawa kepada beban yang dinamik
mengimbangi. Catatan: Pengguguran kerja berpusat akan membebaskan semua sumber (ingatan, pertukaran
ruang) yang diduduki oleh pekerjaan pada masa itu. Ini bertentangan dengan keadaan digantung
pekerjaan tetap, yang masih meliputi ruang swap.
Sekatan
Apabila kerja berpindah ke baris gilir pada mesin lain pada masa ini tiada fail dipindahkan
secara automatik ke mesin itu. Ini bermakna semua fail yang digunakan sepanjang
keseluruhan kerja termasuk fail mulakan semula, fail boleh laku dan scratch mesti kelihatan atau
dipindahkan secara eksplisit (cth pada permulaan skrip kerja).
Terdapat juga beberapa batasan praktikal mengenai penggunaan ruang cakera secara telus
pekerjaan checkpoint. Pusat pemeriksaan bagi aplikasi yang diperiksa secara telus biasanya
disimpan dalam fail atau direktori pusat pemeriksaan oleh sistem pengendalian. Fail atau direktori
mengandungi semua teks, data dan ruang tindanan untuk proses, bersama-sama dengan beberapa tambahan
maklumat kawalan. Ini bermakna pekerjaan yang menggunakan ruang alamat maya yang sangat besar akan
menjana fail pusat pemeriksaan yang sangat besar. Juga stesen kerja di mana pekerjaan akan
sebenarnya execute mungkin mempunyai sedikit ruang cakera kosong. Oleh itu, tidak selalu mungkin untuk
pindahkan kerja pemeriksaan telus ke mesin, walaupun mesin itu melahu.
Oleh kerana kerja memori maya yang besar mesti menunggu mesin yang kedua-duanya melahu dan mempunyai a
jumlah ruang cakera kosong yang mencukupi, pekerjaan tersebut mungkin mengalami masa pemulihan yang lama.
Gunakan sge_ckpt dalam talian menggunakan perkhidmatan onworks.net