Clustering con PVM
Versioni Compatibili Tutte le versioni supportate di Debian |
Introduzione
PVM (Parallel Virtual Machine) è un software che permette a diversi computer in rete di essere utilizzati come se fossero uno solo, aggregando le risorse di ognuno per ottenere una capacità computazionale maggiore.
È una soluzione molto più economica e modulare che incrementare la dotazione hardware (cpu, ram, etc.) di una singola macchina e permette di risolvere problemi molto complessi a costi molto contenuti.
Utilizzato oggi su larga scala, è considerato lo standard per quanto riguarda il calcolo parallelo.
Lo schema di funzionamento è abbastanza semplice: dato un insieme di macchine che si vogliono aggregare in cluster, su ognuna di esse si installerà e configurerà PVM. Ad installazione e configurazione completata, da ciascuna di queste macchine sarà possibile creare una vm cluster aggregando i nodi desiderati.
In questa guida verrà trattata la realizzazione di un cluster composto da due macchine: node0 e node1
Installazione e configurazione
PVM è presente nel ramo main dei repository di Debian e può essere installato semplicemente con:
# apt-get install pvm pvm-dev
Per poterlo utilizzare correttamente si dovrà modificare il file /etc/profile di ogni nodo aggiungendo:
#variable for PVM PVM_ROOT=/usr/lib/pvm3 export PVM_ROOT PVM_ARCH=`$PVM_ROOT/lib/pvmgetarch` export PVM_ARCH PVM_RSH=/usr/bin/ssh export PVM_RSH PVM_TMP=/tmp export PVM_TMP #Add pvm binary to PATH PATH=$PVM_ROOT/bin:$PATH export PATH
Si dovrà anche modificare il file /usr/lib/pvm3/conf/LINUX.def per specificare il metodo che si desidera utilizzare per connettersi (in questo caso ssh):
#LINUX.def ARCHCFLAGS = -DSYSVSIGNAL -DNOWAIT3 -DRSHCOMMAND=\'''"/usr/bin/ssh\"''' \ -DNEEDENDIAN -DFDSETNOTSTRUCT -DHASERRORVARS \ -DCTIMEISTIMET -DSYSERRISCONST
I nodi che faranno parte del cluster dovranno essere specificati nel file /etc/hosts di ogni nodo:
127.0.0.1 localhost 127.0.1.1 debian 192.168.100.1 node0 192.168.100.8 node1
(Si faccia attenzione ad impostare i corretti hostname)
Infine, sempre su ogni nodo, si dovrà creare un utente specifico:
root@nodeX:~# adduser pvmuser
Suggerimento È possibile evitare il dover ripetere le configurazioni effettuate su ciascun nodo a patto di disporre di home directories condivise. |
Connessione SSH senza password
Openssh-server dovrà essere installato su tutti i nodi interessati.
Affinchè i nodi riescano a comunicare senza che sia necessario ogni volta inserire la password di login al momento della connessione ssh si dovrà generare una chiave nel server (si abbia cura di non inserire alcuna password...):
pvmuser@node0:~$ ssh-keygen -t rsa
e trasferirla sui nodi:
pvmuser@node0:~$ ssh-copy-id pvmuser@192.168.100.8
Identificazione dei nodi
Gli hostname degli host "partecipanti" al cluster dovranno essere inseriti nel file .rhosts presente nella home di pvmuser (creare il file se non esiste):
pvmuser@node0:~$ cat /home/pvmuser/.rhosts node1 pvmuser node0 pvmuser
Questa operazione dovrà essere fatta su ciascun nodo del cluster.
Avvio di PVM
PVM è pronto per essere lanciato da uno qualsiasi dei nodi:
pvmuser@node0:~$ pvm pvm> conf conf 1 host, 1 data format HOST DTID ARCH SPEED DSIG node0 40000 LINUX 1000 0x00408841 pvm> add node1 add node1 1 successful HOST DTID node1 80000 pvm> conf conf 2 hosts, 1 data format HOST DTID ARCH SPEED DSIG node0 40000 LINUX 1000 0x00408841 node1 80000 LINUX 1000 0x00408841 pvm> quit quit Console: exit handler called pvmd still running.
Come si può notare tutte le operazioni sono state effettuate dentro la console di pvm.
Nello specifico:
- conf: mostra la configurazione attuale
- add <hostname>: aggiunge l'host all'elenco di pvm
- delete <hostname>: rimuove l'host dall'elenco
- quit: esce dalla console (pvm continua ad agire in background)
- halt: per interrompere pvm
Se si vuole evitare di dover ogni volta inserire gli hostname delle macchine appartenenti al cluster è possibile richiamare un file appositamente creato che contenga l'elenco degli host desiderati:
root@node0:~# cat /etc/pvm.nodes node0 node1
Detto file dovrà essere richiamato in questo modo:
pvmuser@node0:~$ pvm /etc/pvm.nodes
Test di esempio
Nei repository sono presenti dei test di esempio che possono essere avviati dalla console di PVM:
root@node0:~# apt-get install pvm-examples
Per eseguirli dalla console di PVM si utilizzerà il comando spawn -> <program name>:
pvmuser@node0:~$ pvm pvm> spawn -> hello spawn -> hello [5] 1 successful t4000c pvm> [5:t4000c] i'm t4000c [5:t4000c] from t80008: hello, world from node0 [5:t4000c] EOF [5:t80008] EOF [5] finished
Happy clustering!
Suggerimento Per favore se modifichi questa guida aggiungi nel box "NOTE" sottostante "Estesa da: mio_nome_utente", se invece l'hai semplicemente consultata, ma ne hai verificato personalmente la correttezza, aggiungi sempre nello stesso box "Verificata da: mio_nome_utente". In questo modo aiuti la comunità a tenere traccia della maturità della guida. |
NOTE Autore: J3no 12:58, 22 Feb 2007 (CST) Estesa da: pmate 10:47, 17 ott 2011 (CEST) |