Questo è il comando lamboot che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
lamboot - Avvia un multicomputer LAM.
SINOSSI
lamboot [-b] [-d] [-h] [-H] [-l] [-s] [-v] [-V] [-x] [-nn] [-np] [-c conf file ] [-prefisso
/lam/install/percorso/] [valore -sessionprefix] [valore -sessionsuffix]
[-withlamprefixpath valore] [-ssi valore chiave] [bhost]
VERSIONI
-b Supponiamo che la shell locale e remota siano uguali. Ciò significa che solo una shell remota
l'invocazione viene utilizzata per ogni nodo. Se -b non è utilizzato, due invocazioni di shell remote
sono usati per ogni nodo.
-d Attiva l'output di debug. Ciò implica -v.
-h Stampa il menu di aiuto del comando.
-l Ritarda la risoluzione da nome host a indirizzo IP.
-prefisso Utilizzare l'installazione LAM specificata in /lam/install/path/. Non compatibile con
Versioni LAM/MPI precedenti alla 7.1.
-s Chiudere stdio sul nodo locale.
-si chiave APPREZZIAMO
Invia argomenti a vari moduli SSI. Vedere la sezione "SSI", di seguito.
-v Sii prolisso.
-x Esegui in modalità di tolleranza agli errori.
-H Non visualizzare l'intestazione del comando.
-nn Non aggiungere "-n" alla riga di comando dell'agente remoto
-np Non forzare l'esecuzione di $HOME/.profile su host remoti
-prefisso-sessione APPREZZIAMO
Imposta il prefisso della sessione, sovrascrivendo LAM_MPI_SESSION_PREFIX.
-suffisso-sessione APPREZZIAMO
Imposta il suffisso della sessione, sovrascrivendo LAM_MPI_SESSION_SUFFIX.
-conlamprefixpath APPREZZIAMO
Sostituisci il percorso di installazione interno. Solo per uso interno, non utilizzare a meno che
Sai cosa stai facendo.
AMBIENTE VARIABILI
LAM_MPI_SESSION_PREFIX
LAM_MPI_SESSION_SUFFIX
E' possibile cambiare la directory di sessione utilizzata da LAM/MPI, normalmente del
modulo:
tmpdir/lam-nomeutente@nomehost[-suffisso]
tmpdir sarà impostato su LAM_MPI_SESSION_PREFIX se impostato. Altrimenti, ricadrà su
il valore di TMPDIR. Se nessuno di questi è impostato, il valore predefinito è /tmp.
il suffisso può essere sovrascritto da LAM_MPI_SESSION_SUFFIX variabile d'ambiente. Se
LAM_MPI_SESSION_SUFFIX non è impostato e LAM è in esecuzione in un batch supportato
sistema di pianificazione, $suffisso sarà un valore univoco per il lavoro attualmente in esecuzione.
DESCRIZIONE
I scarpone strumento avvia il software LAM su ciascuna delle macchine specificate nel boot
schema, bhost. Lo schema di avvio specifica i nomi host dei nodi da utilizzare nel run-
time MPI e facoltativamente elenca come possono essere utilizzate le CPU LAM su ciascun nodo. Il
l'utente potrebbe voler eseguire prima il recon(1) strumento per verificare che LAM possa essere avviato.
L'avvio di LAM è una procedura in tre fasi. Nel primo passo, hboot(1) è invocato su ciascuno dei
le macchine specificate. Quindi ogni macchina alloca una porta dinamica e la comunica
torna a scarpone che li raccoglie. Nella terza fase, scarpone dà ad ogni macchina il
elenco di macchine/porte per formare una topologia completamente connessa. Se una macchina fosse
non è possibile avviare o se un periodo di timeout scade prima del completamento del primo passaggio, scarpone
invoca lampo(1) per terminare LAM e segnala l'errore.
I bhost file è uno schema di avvio LAM scritto nella sintassi del file host. Vedere bhost(5).
Invece della riga di comando, è possibile specificare uno schema di avvio nell'ambiente LAMBHOST
variabile. Altrimenti viene utilizzato un file predefinito, lam-bhost.def. LAM cerca bhost prima di tutto
nella directory locale e poi nella directory di installazione sotto etc/.
Inoltre, scarpone utilizza uno schema di processo per i singoli nodi LAM. Uno schema di processo
(Vedi conf(5)) è una descrizione dei processi che costituiscono il sistema operativo su un
nodo. In generale, l'amministratore di sistema mantiene questo file -- gli utenti LAM/MPI lo faranno
generalmente non è necessario modificare questo file. È anche possibile per l'utente personalizzare il
Software LAM con uno schema di processo privato.
I bhost filetto
Il formato del file bhost file è documentato nel bhost(5) pagina man.
scarpone risolverà tutti i nomi in bhost sul nodo in cui scarpone è stato invocato (il
nodo di origine). Successivamente, LAM utilizzerà solo indirizzi IP, non nomi. Nello specifico, il
la configurazione della risoluzione dei nomi su tutti gli altri nodi non viene utilizzata. Quindi, il nodo di origine
deve essere in grado di risolvere tutti i nomi in bhost ad indirizzi raggiungibili da tutti
altri nodi.
Un errore comune è elencare localhost (o qualsiasi nome che si risolva nell'indirizzo speciale
127.0.0.1 -- il dispositivo TCP/IP di loopback) in a bhost file che contiene altri nodi. In
questo caso, l'indirizzo 127.0.0.1 verrebbe inviato a ciascuno degli altri nodi come indirizzo
del nodo di origine. Se gli altri nodi tentano di utilizzare 127.0.0.1 per contattare il nodo di origine,
si metteranno effettivamente in contatto con se stessi e alla fine andranno in timeout e falliranno.
Gli indirizzi IP ottenuti da bhost sono usati per i meta messaggi di LAM: startup e
chiusura di lavori, messaggi fuori banda utilizzati per il coordinamento, ecc. La quantità di traffico
è abbastanza basso (a meno che non si utilizzi la modalità "lamd" del passaggio di messaggi MPI, nel qual caso tutti MPI
il traffico utilizzerà anche i meta messaggi di LAM per il trasporto - vedi mpirun(1)). Quando si usa
l'RPI TCP, questi indirizzi IP vengono utilizzati anche per il passaggio di messaggi MPI tramite socket diretti
tra ogni coppia di nodi.
Un caso comune è quello in cui un nodo "master" ha più schede di interfaccia di rete (NIC) -- una
che è connesso a una rete pubblica e uno che è connesso a una rete privata
dove devono essere eseguiti i lavori paralleli. Per includere il nodo master in a bhost file, l'IP
nome (o indirizzo) della NIC sulla rete privata dovrebbe essere elencato in bhost. Questo
assicura che tutti gli altri nodi possano raggiungere il nodo master sulla rete privata.
Come altro esempio, alcune configurazioni hanno più NIC TCP/IP in ogni nodo di a
lavoro parallelo. Una NIC è considerata "lenta" (ad es. 10Mbps), mentre l'altra è considerata
"veloce" (ad es. 100Mbps). È auspicabile consentire a LAM di sfruttare il maggiore
larghezza di banda sulla rete "veloce" per i messaggi MPI. Come tale, bhost dovrebbe elencare i nomi IP
(o indirizzi) di tutte le NIC "veloci". Tuttavia, se LAM RPI non utilizza TCP/IP (ad es.
il Myrinet/GM RPI), il bhost il file dovrebbe probabilmente elencare le NIC "lente" in modo che LAM's
il traffico dei meta messaggi non causa sovraccarico e potenzialmente riduce le prestazioni in avanti
la rete "veloce" da altre applicazioni ad alte prestazioni.
ritardare hostname ricerche
Normalmente, la risoluzione dei nomi degli host viene eseguita sulle macchine in cui scarpone viene invocato.
Questo viene fatto per motivi di ottimizzazione, in modo che l'elenco dei nomi host debba essere solo
risolto una volta (potenzialmente riducendo al minimo la quantità di DNS o altra rete di ricerca del nome host
traffico).
Tuttavia, in alcuni ambienti di rete non uniformi, questo non è sufficiente perché ciascuno
host può avere un indirizzo IP diverso su ciascuno dei suoi peer. Ad esempio, l'host A potrebbe avere
l'indirizzo Z sull'host B, ma l'indirizzo Y sull'host C.
I -l opzione a scarpone farà sì che LAM distribuisca i nomi host a ciascun nodo anziché a
set di indirizzi IP completamente risolto. Quindi, ogni nodo in cui viene avviato LAM farà il suo
risoluzione dei nomi nell'elenco dei nomi host.
SSI (Sistema Servizi Interfaccia)
I -si switch consente il passaggio di parametri a vari moduli SSI. SSI . di LAM
i moduli sono descritti in dettaglio in lamsi(7). I moduli SSI hanno un impatto diretto su MPI
programmi perché consentono di impostare parametri sintonizzabili in fase di esecuzione (come quale avvio
driver del dispositivo da utilizzare, quali parametri passare a quel driver, ecc.).
I -si switch accetta due argomenti: chiave ed APPREZZIAMO. chiave l'argomento generalmente specifica
quale modulo SSI riceverà il valore. Ad esempio, il chiave "boot" è usato per selezionare
quale RPI utilizzare per avviare i processi sui nodi remoti. Il APPREZZIAMO argomento è il
valore passato. Per esempio:
lamboot -ssi boot tm
Dice a LAM di utilizzare il modulo di avvio "tm" per l'avvio nativo in PBSPro / OpenPBS
ambienti (il modulo di avvio tm non richiede uno schema di avvio).
lamboot -ssi boot rsh -ssi rsh_agent "ssh -x" boot_schema
Dice a LAM di usare il modulo di avvio "rsh" e dice al modulo rsh di usare "ssh -x" come
l'agente specifico per avviare gli eseguibili sui nodi remoti.
E così via. I moduli SSI di avvio di LAM sono descritti in lamssi_boot(7). Questa pagina dovrebbe essere
consultato per azioni specifiche intraprese da e come modificare il comportamento in fase di esecuzione
di ogni modulo di avvio.
I -si l'interruttore può essere utilizzato più volte per specificare diversi chiave e / o APPREZZIAMO
argomenti. Se lo stesso chiave è specificato più di una volta, il APPREZZIAMOs sono concatenati con
una virgola (",") che li separa.
Notare quello -si switch è semplicemente una scorciatoia per impostare le variabili di ambiente. Il
lo stesso effetto può essere ottenuto impostando le corrispondenti variabili di ambiente prima
running scarpone. La forma delle variabili di ambiente che LAM imposta è:
LAM_MPI_SSI_key=valore.
Notare quello -si switch sovrascrive qualsiasi variabile di ambiente impostata in precedenza. Nota anche
quello sconosciuto chiave gli argomenti sono ancora impostati come variabili d'ambiente -- non sono controllati
(di lampo) per correttezza. Illegale o scorretto APPREZZIAMO gli argomenti possono o non possono essere
segnalato -- dipende dal modulo SSI specifico.
Assistenza eseguibile Invocazione
Tutti gli aspetti modificabili dell'avvio di eseguibili su nodi remoti durante scarpone sono
discusso in lamsi(7) e lamssi_boot(7). Gli argomenti includono (ma non sono limitati a):
scoperta della shell remota, override runtime dell'agente utilizzato per avviare remote
eseguibili (ad es. rsh e ssh), ecc.
Chiusura stdio
Lo stdio di ogni demone LAM su un host remoto lanciato da scarpone è chiuso da
predefinito. Normalmente, lo stdio del demone LAM lanciato sull'host locale viene lasciato aperto quindi
che la LAM . interna stdio(3) il pacchetto funziona correttamente. Tuttavia, a volte è
desiderabile chiudere anche lo stdio del demone LAM locale. Per esempio:
rsh somenode lamboot -s file host
Questo è perché rsh attende due condizioni prima di uscire: scarpone per uscire e stdout /
stderr da chiudere. Privo di -s, stdout / stderr non verrebbe chiuso e rsh (E SSH)
si bloccherà anche se scarpone aveva completato. -s provoca lo stdout / stderr del locale
Il demone LAM verrà chiuso al momento dell'invocazione, il che consentirà rsh completare. Usando -s volere
nessun effetto scarpone in qualsiasi altro modo, ma impedirà il stdio(3) pacchetto da
funziona correttamente.
Guasto Tolleranza
Se l' -x l'opzione è data, LAM funziona in modalità fault tolerant. In questa modalità, i nodi si scambiano
Messaggi di ``battito cardiaco'' periodicamente per assicurarsi che tutti i nodi siano in esecuzione e i collegamenti
collegarli sono operativi. Quando il cuore di un nodo si ferma, viene dichiarato "morto"
e tutti i nodi (e processi) LAM vengono notificati. Ciò consente agli utenti di scrivere con tolleranza agli errori
applicazioni che possono degradare con grazia o recuperare completamente sostituendo il nodo defunto
con un altro (vedi lammrow(1)). Poiché questa modalità introduce una penalizzazione delle prestazioni, è
non attivato per impostazione predefinita.
ESEMPI
stivaletto -v
Avvia LAM sulle macchine descritte nello schema di avvio predefinito. Segnala su
passi importanti man mano che vengono eseguiti.
lamboot -d file host
Avvia LAM sulle macchine descritte nel file file host. Fornisci incredibilmente dettagliati
segnala ciò che sta accadendo in ogni fase del processo di avvio.
lamboot mynodi
Avvia LAM sulle macchine descritte nello schema di avvio mionodi. Operare in silenzio.
Usa lamboot online utilizzando i servizi onworks.net