Nuovo cluster per il calcolo parallelo nell’Università di Bologna

Data di pubblicazione: 2011

Le esigenze - Mantenere laboratori e strumenti didattici costantemente allineati all’evoluzione tecnologicaTop

All’interno dell’Università di Bologna, il Corso di Laurea in Scienza e Tecnologie Informatiche del polo didattico di Cesena rinnova periodicamente i sistemi hardware e software presenti nei propri laboratori per offrire a studenti, professori e ricercatori strumenti di ricerca e sperimentazione costantemente allineati all’evoluzione tecnologica e alle richieste applicative di mercato. Il sistema operativo dei client utilizzati per la didattica dell’intero corso di laurea è Microsoft Windows 7, installato su tutti i personal computer presenti nei tre laboratori. La sperimentazione delle potenzialità di calcolo offerte oggi dai sistemi di High Performance Computing e lo sviluppo di applicazioni basate sul calcolo parallelo vengono considerati elementi imprescindibili per la qualità della didattica e della ricerca universitaria, come spiega Giuseppe Levi, professore presso il polo didattico di Cesena.
“Oggi il mondo dell’informatica è sempre più orientato verso la programmazione parallela”, premette Giuseppe Levi. “Abbiamo quindi ritenuto che all’interno di un corso di laurea in informatica non potesse mancare un laboratorio e un corso in quest’ambito. Il nostro obiettivo di mantenere costantemente aggiornata la struttura didattica prevedeva inoltre di offrire agli studenti un vero cluster su cui sperimentare nuove applicazioni”.
Insegnanti e personale tecnico del Corso di Laurea in Scienza e Tecnologie Informatiche hanno quindi colto l’occasione del rinnovamento di uno dei laboratori per progettare l’implementazione di un sistema di calcolo ad alte prestazioni con un cluster di workstation in grado di garantire l’elaborazione parallela evitando i costi derivati dall’adozione di macchine dedicate. L’opzione in ambiente Linux non è stata presa in considerazione per il maggiore impegno economico e per la minore efficacia sul piano didattico, mentre la tecnologia Microsoft Windows HPC Server 2008 R2 consentiva di realizzare un laboratorio di High Performance Computing sfruttando al meglio la capacità di calcolo già presente nell’infrastruttura.
“L’implementazione di un cluster in ambiente Linux avrebbe richiesto un’infrastruttura dedicata e non sarebbe risultato efficace dal punto di vista didattico poiché si sarebbe rischiato di produrre prototipi autoreferenziali”, dichiara Giuseppe Levi. “Al contrario, noi vogliamo utilizzare standard riconosciuti e diffusi come sono le tecnologie Microsoft per consentire a studenti e ricercatori di realizzare sistemi che trovino facilmente applicazione nell’industria e risultino facilmente riproducibili”.

La soluzione - Massima semplicità di installazione e configurazione del clusterTop

L’aggiornamento dei sistemi utilizzati dal Laboratorio 2 del Corso di Laurea in Scienza e Tecnologie Informatiche con l’adozione di Microsoft Windows HPC Server 2008 R2 si è concluso in tempi rapidissimi. In una sala server del polo didattico di Cesena è stato installato un head node virtuale, master del cluster, a cui si sono connesse le macchine client su Windows 7 per realizzare un cluster di workstation. L’implementazione del nuovo sistema di High Performance Computing è terminata in una settimana, a cui è seguito un breve periodo per il fine tuning e per l’installazione di librerie C# e C++. Per consentire la massima flessibilità nella programmazione parallela è stato anche implementato Microsoft Visual Studio 2010. Giuseppe Levi ha supervisionato il progetto e ha trasmesso in modo informale al personale tecnico del polo le competenze utili per la gestione del nuovo sistema, che non ha quindi richiesto alcuna attività di formazione specifica.
“L’implementazione di Microsoft Windows HPC Server 2008 R2 è semplicissima: l’head node viene installato in modo automatico e il cluster comicia a funzionare in meno di due ore”, sottolinea Levi. “Il supporto online e telefonico offerto da Microsoft è molto efficiente e permette sia di risolvere rapidamente eventuali piccole criticità, sia di aggiornare le competenze tecniche del personale. In fase di installazione e personalizzazione del cluster di workstation, la tecnologia e le persone Microsoft hanno superato le nostre aspettative in termini di qualità e livelli di servizio”.

I benefici - Valorizzare l’infrastruttura esistente e ridurre al minimo i costi di un sistema High Performance computingTop

La tecnologia Microsoft Windows HPC Server 2008 R2 ha consentito al polo didattico di Cesena di realizzare rapidamente e a costi molto ridotti un cluster di elaborazione parallela utilizzabile sia per la didattica sia per la ricerca. La formazione degli studenti del Corso di Laurea in Scienza e Tecnologie Informatiche avviene oggi su una macchina parallela ad alte prestazioni e con un sistema di sviluppo all’avanguardia. Semplicità, velocità di calcolo, stabilità dei sistemi ed economicità di implementazione sono le caratteristiche unanimemente apprezzate all’interno dell’ateneo.
“Windows HPC Server 2008 R2 ci permette di offrire corsi all’avanguardia agli studenti e una infrastruttura di calcolo ai ricercatori, valorizzando al massimo gli investimenti già effettuati nei laboratori ed evitando di aumentare il carico di lavoro sul personale tecnico, che resta pienamente disponibile per la gestione degli altri servizi applicativi”, afferma Giuseppe Levi. “Questa tecnologia ci ha permesso di evitare l’acquisizione di nuove macchine e di sfruttare le licenze Windows 7 già esistenti, mentre un cluster Linux avrebbe presentato tempi e costi molto più elevati sia per l’implementazione, sia per l’acquisizione di sistema operativo e componenti aggiuntivi per l’elaborazione parallela”.
Le stime effettuate prima della scelta di Windows HPC Server 2008 R2 hanno evidenziato un costo pari a 500 euro per la tecnologia di High Performance Computing Microsoft, contro una possibile spesa di 15.000 euro per un piccolo cluster a 4 nodi configurato per il calcolo parallelo, oltre alle decine di migliaia di euro necessarie per la nuova rete dedicata.

I benefici - Potenza elevata, nuove opportunità di ricerca e completa automazione delle procedure di gestioneTop

La potenza di calcolo e le possibilità di sperimentazione offerte a studenti e ricercatori dal nuovo cluster Windows HPC Server 2008 R2 sono elevatissime rispetto ai costi e alla semplicità di gestione del sistema. La potenza di calcolo oggi disponibile nel Laboratorio 2 del polo didattico di Cesena costituito da 32 worstation collegate con una comune rete ethernet da 100 Mbit/s, è pari ad almeno 150 Gigaflop. Questo valore, misurato dal Benchmark Tool Lizard basato su Linpack, può essere considerato un limite inferiore e sarà facilmente aumentabile aggiornando, per esempio, il concentratore di rete e portandolo dagli attuali 100Mb/s a 1Gb/s. L’installazione dell’infrastruttura HPC ha inoltre migliorato notevolmente la facilità di gestione delle workstations tramite per esempio il comando “clusrun” che permette di eseguire la stessa operazione contemporaneamente su tutte le macchine.
“Abbiamo realizzato con la massima semplicità un’infrastruttura con altissimo valore didattico e mi risulta che il nostro ateneo sia il primo in Europa a utilizzare un sistema di elaborazione parallela con queste caratteristiche”, conclude Giuseppe Levi. “La nostra esperienza potrebbe essere facilmente replicata da altre università con un impegno economico molto ridotto. Oltre all’elevata potenza di calcolo e alla possibilità di condurre esperimenti di programmazione molto interessanti, riusciamo a effettuare in un’ora operazioni di manutenzione che prima richiedevano un giorno di lavoro e comportavano notevoli rischi di errore. Questi risultati hanno destato l’interesse di numerosi colleghi e prevedo quindi importanti sviluppi della tecnologia Windows HPC Server 2008 R2 all’interno della nostra Università”.
Il nuovo cluster di calcolo parallelo ha rapidamente conquistato l’interesse degli studenti, che stanno oggi esprimendo grande creatività nello sviluppo applicativo.
I linguaggi di programmazione usati sono il C++, usando le librerie MS_MPI, OpenMP e la Parallel Computing Platform inclusa in Visual Studio, e il C# usando, per la programmazione su cluster le librerire MPI.NET dell’Università dell’Indiana (USA).
All’interno del Corso di Laurea in Scienza e Tecnologie Informatiche, la tecnologia Microsoft Windows HPC Server 2008 R2 verrà presto estesa agli altri laboratori e resa disponibile a tutti i ricercatori, anche utilizzando i servizi di Windows Azure per aggiungere nodi “cloud” al cluster.


Il cliente

"Questa tecnologia ci ha permesso di evitare l’acquisizione di nuove macchine e di sfruttare le licenze Windows 7 già esistenti, mentre un cluster Linux avrebbe presentato tempi e costi molto più elevati sia per l’implementazione, sia per l’acquisizione di sistema operativo e componenti aggiuntivi per l’elaborazione parallela"

Giuseppe Levi, Professore presso il polo didattico di Cesena

Case History in breve

  • Dimensione azienda: Grande Azienda
  • Settore industriale: Education
  • Scenari:
    • Infrastruttura
  • Esigenze di Business:
    • Aggiornamento dei server
  • Vantaggi: Disponibilità di un cluster per il calcolo parallelo a costi estremamente contenuti; massima valorizzazione delle capacità di calcolo presenti nel laboratorio; elevata qualità dell’offerta didattica e della ricerca; automazione delle procedure e riduzione al minimo dell’impegno di gestione sistemistica; grande coinvolgimento di studenti e docenti nei confronti delle nuove tecnologie; definizione di una best practice facilmente replicabile e di una piattaforma aperta all’evoluzione.
  • Risparmio: Implementazione di un cluster su Microsoft Windows HPC Server 2008 R2 in un laboratorio didattico; configurazione parallela delle workstation Windows 7 preesistenti; fine tuning e installazione delle librerie per lo sviluppo applicativo.
  • Regione: Emilia-Romagna