InglésFrancésEspañol

Ad


icono de página de OnWorks

sge_ckpt - Online en la nube

Ejecute sge_ckpt en el proveedor de alojamiento gratuito de OnWorks sobre Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando sge_ckpt que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


sge_ckpt.1: el mecanismo de puntos de control de Sun Grid Engine y el soporte de puntos de control

DESCRIPCIÓN


Sun Grid Engine admite dos niveles de puntos de control: el nivel de usuario y un
sistema proporcionado nivel transparente. Los puntos de control de nivel de usuario se refieren a aplicaciones, que
hacer sus propios puntos de control escribiendo archivos de reinicio en ciertos momentos o pasos algorítmicos
y procesando correctamente estos archivos de reinicio cuando se reinicia.

El sistema operativo debe proporcionar puntos de control transparentes y, por lo general,
integrado en el kernel del sistema operativo. Un ejemplo de kernel integrado
La función de checkpointing es el paquete Hibernator de Softway para plataformas SGI IRIX.

Los trabajos de puntos de control deben identificarse en el sistema Sun Grid Engine mediante el -ckpt
opción del qsub1() comando. El argumento de esta bandera se refiere a un llamado
entorno de puntos de control, que define los atributos del método de puntos de control para ser
usado (ver puesto de control5() para detalles). Los entornos de puntos de control son configurados por el
qconf1() opciones -aceptar, -dckpt, -mckpt y -sckpt. qsub1() opción -c puede ser usado para
sobrescribir el cuando atributo para el entorno de puntos de control al que se hace referencia.

Si una cola es del tipo CHECKPOINTING, los trabajos deben tener el atributo checkpointing
marcado (ver el -ckpt opción de qsub1()) para poder ejecutarse en dicha cola. Como
opuesto al comportamiento de los trabajos por lotes regulares, los trabajos de puntos de control se cancelan bajo
condiciones, para las cuales los trabajos por lotes o interactivos se suspenden o incluso no se ven afectados.
Estas condiciones son:

· Suspensión explícita de la cola o el trabajo a través de qmod1() por la administración del clúster o un
propietario de la cola si el x especificador de ocasión (ver qsub1() -c y puesto de control5()) fue asignado
al trabajo.

· Un valor promedio de carga que excede el umbral de suspensión configurado para el
colas correspondientes (ver cola_conf5().)

· Apagado del demonio de ejecución Sun Grid Engine sge_execd8() siendo responsable de la
trabajo de checkpointing.

Después del aborto, los trabajos se migrarán a otras colas a menos que se envíen a una
cola específica por una solicitud explícita del usuario. La migración de puestos de trabajo conlleva una carga dinámica
Equilibrio. Nota: El aborto de trabajos controlados liberará todos los recursos (memoria, intercambio
espacio) que ocupa el puesto en ese momento. Esto se opone a la situación de suspensión
trabajos regulares, que aún cubren el espacio de intercambio.

RESTRICCIONES


Cuando un trabajo se migra a una cola en otra máquina, actualmente no se transfieren archivos
automáticamente a esa máquina. Esto significa que todos los archivos que se utilizan en todo el
Todo el trabajo, incluidos los archivos de reinicio, los ejecutables y los archivos temporales, debe estar visible o
transferido explícitamente (por ejemplo, al comienzo del script de trabajo).

También existen algunas limitaciones prácticas con respecto al uso del espacio en disco para
trabajos de checkpointing. Los puntos de control de una aplicación controlada de forma transparente suelen ser
almacenado en un archivo o directorio de punto de control por el sistema operativo. El archivo o directorio
contiene todo el texto, los datos y el espacio de pila para el proceso, junto con algunos
información de control. Esto significa que los trabajos que utilizan un espacio de direcciones virtuales muy grande
generar archivos de puntos de control muy grandes. También las estaciones de trabajo en las que se realizarán los trabajos.
ejecutar realmente puede tener poco espacio libre en disco. Por tanto, no siempre es posible
transferir un trabajo de puntos de control transparente a una máquina, aunque esa máquina esté inactiva.
Dado que los trabajos de memoria virtual grandes deben esperar a que una máquina esté inactiva y
suficiente espacio libre en disco, estos trabajos pueden sufrir tiempos de respuesta prolongados.

Use sge_ckpt en línea usando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

Comandos de Linux

Ad