GoGPT Best VPN GoSearch

icono de página de OnWorks

strigger - Online en la nube

Ejecute strigger en el proveedor de alojamiento gratuito de OnWorks sobre Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando strigger que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


strigger: se utiliza para establecer, obtener o borrar la información del disparador de Slurm.

SINOPSIS


gatillo --colocar [OPCIONES...]
gatillo --obtener [OPCIONES...]
gatillo --claro [OPCIONES...]

DESCRIPCIÓN


gatillo se utiliza para configurar, obtener o borrar información de disparo de Slurm. Los desencadenantes incluyen eventos
como un nodo que falla, un trabajo que alcanza su límite de tiempo o un trabajo que finaliza. Estos eventos
puede provocar acciones como la ejecución de un script arbitrario. Los usos típicos incluyen
notificar a los administradores del sistema sobre fallas en los nodos y finalizar un trabajo de manera ordenada cuando
se acerca el límite de tiempo. Una expresión de lista de hosts para la lista de nodos o ID de trabajo es
pasado como argumento al programa.

Los eventos de activación no se procesan instantáneamente, pero se realiza una verificación de eventos de activación en
de forma periódica (actualmente cada 15 segundos). Cualquier evento desencadenante que ocurra dentro de ese
El intervalo se comparará con los programas de activación establecidos al final del tiempo.
intervalo. El programa de activación se ejecutará una vez para cualquier evento que ocurra en ese
intervalo. El registro de esos eventos (por ejemplo, los nodos que bajaron en los últimos 15
segundos) se borrarán. El programa de activación debe establecer un nuevo activador antes del final.
del siguiente intervalo para asegurar que no se pierda ningún evento disparador O el disparador debe ser
creado con un argumento de "--flags = PERM". Si lo desea, se pueden configurar varios programas de activación.
establecido para el mismo evento.

IMPORTANTE NOTA: Este comando solo puede establecer activadores si lo ejecuta el usuario SlurmUsuario a menos que
SlurmUsuario está configurado como usuario root. Esto es necesario para slurmctld demonio para configurar
los ID de usuario y grupo apropiados para el programa ejecutado. También tenga en cuenta que el gatillo
El programa se ejecuta en el mismo nodo que el slurmctld daemon usa en lugar de algunos
nodo de cálculo asignado. Para comprobar el valor de SlurmUsuario, ejecuta el comando:

control show config | grep SlurmUsuario

ARGUMENTOS


-a, --primary_slurmctld_failure
Activa un evento cuando falla el slurmctld primario.

-A, --primary_slurmctld_resumed_operación
Activa un evento cuando el slurmctld principal reanuda la operación después de una falla.

-b, --primary_slurmctld_resumed_control
Activa un evento cuando el slurmctld primario retoma el control.

--block_err
Activa un evento cuando un bloque BlueGene entra en un estado de ERROR.

-B, --backup_slurmctld_failure
Activa un evento cuando falla el slurmctld de respaldo.

-c, --backup_slurmctld_resumed_operación
Activa un evento cuando la copia de seguridad slurmctld reanuda su funcionamiento después de una falla.

-C, --backup_slurmctld_assumed_control
Activa el evento cuando el slurmctld de respaldo asume el control.

--claro
Limpiar o eliminar un activador de evento definido previamente. los --identificación, --Identificación del trabajo or --usuario
Se debe especificar la opción para identificar el (los) disparador (es) que se borrarán. Solo usuario root
o el creador del disparador puede eliminar un disparador.

-d, --abajo
Activa un evento si el nodo especificado entra en un estado ABAJO.

-D, --agotado
Activa un evento si el nodo especificado entra en un estado DRAINED.

-e, --primary_slurmctld_acct_buffer_full
Active un evento cuando el búfer de contabilidad slurmctld primario esté lleno.

-F, --fallar
Activa un evento si el nodo especificado entra en un estado FAILING.

-f, --fini
Activa un evento cuando el trabajo especificado completa la ejecución.

--banderas=tipo
Asociar banderas con la reserva. Varias banderas deben estar separadas por comas.
Las banderas válidas incluyen:

PERM Haga que el disparador sea permanente. No lo purgue después de que ocurra el evento.

--Interfaz
Activar eventos basados ​​en cambios en el estado de los nodos de front-end en lugar de computar
nodos. Se aplica solo a las arquitecturas BlueGene y Cray, donde el demonio slurmd
se ejecuta en los nodos frontales en lugar de en los nodos de cómputo. Utilice esta opción con
o bien el --hasta or --abajo .

-g, --primary_slurmdbd_failure
Activa un evento cuando falla el slurmdbd primario.

-G, --primary_slurmdbd_resumed_operación
Activa un evento cuando el slurmdbd primario reanuda su funcionamiento después de una falla.

--obtener Muestra los activadores de eventos registrados. Las opciones se pueden utilizar con fines de filtrado.

-h, --fallo_base_de_datos_primaria
Activa un evento cuando falla la base de datos primaria.

-H, --operación_reanudada_base_de_datos_primaria
Activa un evento cuando la base de datos principal reanuda su funcionamiento después de un error.

-i, --identificación=id
Número de identificación del disparador.

-I, --inactivo
Activar un evento si el nodo especificado permanece en un estado inactivo durante al menos el
período de tiempo especificado por el --compensar opción. Esto puede resultar útil para hibernar un
nodo que permanece inactivo, reduciendo así el consumo de energía.

-j, --Identificación del trabajo=id
ID de trabajo de interés. NOTA: La --Identificación del trabajo La opción no se puede utilizar junto con
la --nodo opción. Cuando el --Identificación del trabajo La opción se utiliza junto con la --hasta or
--abajo opción, todos los nodos asignados a ese trabajo se considerarán los nodos utilizados como
acontecimiento desencadenante.

-M, - racimos=<cadena>
Clústeres para emitir comandos.

-n, --nodo[=host]
Nombre (s) de host de interés. De forma predeterminada, todos los nodos asociados con el trabajo (si
--Identificación del trabajo se especifica) o en el sistema se tienen en cuenta para los desencadenantes de eventos. NOTA:
La --nodo La opción no se puede utilizar junto con la --Identificación del trabajo opción. Cuando el
--Identificación del trabajo La opción se utiliza junto con la --hasta, --abajo or --agotado opción,
todos los nodos asignados a ese trabajo se considerarán los nodos utilizados como un evento desencadenante.
Dado que el argumento de esta opción es opcional, para analizar correctamente la letra única
La opción debe ser seguida inmediatamente con el valor y no incluir un espacio entre
ellos. Por ejemplo, "-ntux" y no "-n tux".

-N, --sin encabezado
No imprima el encabezado cuando muestre una lista de desencadenantes.

-o, --compensar=segundos
La acción especificada debe seguir al evento en este intervalo de tiempo. Especifique un
valor negativo si la acción debe preceder al evento. El valor predeterminado es cero si
no --compensar se especifica la opción. La resolución de este tiempo es de unos 20 segundos,
para ejecutar un script no menos de cinco minutos antes de que un trabajo llegue a su tiempo
límite, especificar --desplazamiento = 320 (5 minutos más 20 segundos).

-p, --programa=camino
Ejecute el programa en la ruta de acceso completa especificada cuando el evento
ocurre. Puede citar la ruta e incluir argumentos de programa adicionales si lo desea.
El programa se ejecutará como el usuario que configura el disparador. Si el programa
no termina dentro de los 5 minutos, se matará junto con cualquier engendrado
de los empleados.

-Q, --tranquilo
No informe errores no fatales. Esto puede resultar útil para eliminar los desencadenantes que pueden
ya se han purgado.

-r, --reconfigurar
Activa un evento cuando cambia la configuración del sistema. Esto se activa cuando el
El demonio slurmctld lee su archivo de configuración o cuando cambia el estado de un nodo.

--colocar Registre un desencadenante de eventos según las opciones proporcionadas. NOTA: Un evento es solo
desencadenado una vez. Se debe establecer un nuevo activador de eventos para eventos futuros de
el mismo tipo para ser procesado. Los disparadores solo se pueden configurar si el comando es ejecutado por
el usuario SlurmUsuario a menos que SlurmUsuario está configurado como usuario root.

-t, --tiempo
Activa un evento cuando se alcanza el límite de tiempo del trabajo especificado. Esto debe ser usado
en conjunción con la --Identificación del trabajo .

-u, --hasta
Activa un evento si el nodo especificado vuelve al servicio desde un estado ABAJO.

--usuario=nombre_de_usuario_o_id
Borrar u obtener disparadores creados por el usuario especificado. Por ejemplo, un disparador
creado por el usuario raíz para un trabajo creado por el usuario Adán podría borrarse con una opción
--usuario = root. Especifique un nombre de usuario o una ID de usuario.

-v, --verboso
Imprima el registro de eventos detallado. Esto incluye marcas de tiempo en estructuras de datos, registro
recuentos, etc.

-V , --versión
Imprime la información de la versión y sal.

SALIDA CAMPO DESCRIPCIONES


TRIG_ID
Número de identificación del disparador.

RES_TIPO
Tipo de recurso: trabajo or nodo

RES_ID ID de recurso: ID de trabajo o nombres de host o "*" para cualquier host

TIPO Tipo de disparador: time or para (solo para trabajos), DE INSCRIPCIÓN or up (para trabajos o nodos), o
Escurridos , ocioso or reconfigurar (solo para nodos)

OFFSET Desplazamiento de tiempo en segundos. Los números negativos indicaron que la acción debería ocurrir antes
el evento (si es posible)

USUARIO Nombre del usuario que solicita la acción.

PROGRAMA
Nombre de ruta del programa que se ejecutará cuando ocurra el evento

MEDIO AMBIENTE VARIABLES


Cosas gatillo las opciones se pueden configurar mediante variables de entorno. Estas variables de entorno,
junto con sus opciones correspondientes, se enumeran a continuación. (Nota: las opciones de la línea de comandos
anule siempre estos ajustes)

Slurm_conf La ubicación del archivo de configuración de Slurm.

EJEMPLOS


Ejecute el programa "/ usr / sbin / primary_slurmctld_failure" siempre que el slurmctld primario
falla.

> cat / usr / sbin / primary_slurmctld_failure
#!/ bin / bash
# Enviar disparador para el próximo evento de falla de slurmctld primario
activador --set --primary_slurmctld_failure \
--programa = / usr / sbin / primary_slurmctld_failure
# Notifique al administrador de la falla usando por correo electrónico
/ usr / bin / mail [email protected] -s Primario_SLURMCTLD_FAILURE

> strigger --set --primary_slurmctld_failure \
--programa = / usr / sbin / primary_slurmctld_failure

Ejecute el programa "/ usr / sbin / slurm_admin_notify" cada vez que algún nodo del clúster se active
abajo. La línea de asunto incluirá los nombres de los nodos que han entrado en estado inactivo.
(pasado como argumento al guión por Slurm).

> cat / usr / sbin / slurm_admin_notify
#!/ bin / bash
# Enviar disparador para el próximo evento
activador --establecer --nodo --abajo \
--programa = / usr / sbin / slurm_admin_notify
# Notificar al administrador mediante correo electrónico
/ usr / bin / mail [email protected] -s NodesDown: $ *

> strigger --set --node --down \
--programa = / usr / sbin / slurm_admin_notify

Ejecute el programa "/ usr / sbin / slurm_suspend_node" siempre que cualquier nodo del clúster
permanece en estado inactivo durante al menos 600 segundos.

> strigger --set --node --idle --offset = 600 \
--programa = / usr / sbin / slurm_suspend_node

Ejecute el programa "/ home / joe / clean_up" cuando el trabajo 1234 esté dentro de los 10 minutos de haber llegado
su límite de tiempo.

> strigger --set --jobid = 1234 --time --offset = -600 \
--programa = / inicio / joe / clean_up

Ejecute el programa "/ home / joe / node_died" cuando cualquier nodo asignado al trabajo 1234 ingrese al
Estado ABAJO.

> strigger --set --jobid = 1234 --down \
--programa = / inicio / joe / node_died

Muestra todos los desencadenantes asociados con el trabajo 1235.

> strigger --get --jobid = 1235
TRIG_ID RES_TYPE RES_ID TYPE OFFSET USUARIO PROGRAMA
123 trabajo 1235 tiempo -600 joe / home / bob / clean_up
125 trabajo 1235 abajo 0 joe / home / bob / node_died

Eliminar activador de evento 125.

> strigger --clear --id = 125

Ejecute / home / joe / job_fini al finalizar el trabajo 1237.

> strigger --set --jobid = 1237 --fini --program = / home / joe / job_fini

COPIA


Copyright (C) 2007 The Regents de la Universidad de California. Producido en Lawrence
Laboratorio Nacional de Livermore (cf, DESCARGO DE RESPONSABILIDAD).
Copyright (C) 2008-2010 Lawrence Livermore Seguridad Nacional.
Derechos de autor (C) 2010-2013 SchedMD LLC.

Este archivo es parte de Slurm, un programa de gestión de recursos. Para obtener más detalles, consulte
<http://slurm.schedmd.com/>.

Slurm es un software gratuito; puedes redistribuirlo y / o modificarlo bajo los términos de la
Licencia pública general GNU publicada por la Free Software Foundation; ya sea la versión 2
de la Licencia, o (a su elección) cualquier versión posterior.

Slurm se distribuye con la esperanza de que sea útil, pero SIN NINGUNA GARANTÍA; sin
incluso la garantía implícita de COMERCIABILIDAD o APTITUD PARA UN PROPÓSITO PARTICULAR. Ver el
Licencia pública general de GNU para más detalles.

Use strigger en línea usando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

Comandos de Linux

Ad




×
Anuncio
❤ ️Compre, reserve o adquiera aquí: sin costo, ayuda a mantener los servicios gratuitos.