Magyar Szuperszámítógép Grid projekt

Kacsuk Péter, prof. Dr. <kacsuk@sztaki.hu>

MTA SZTAKI


A magyar szuperszámítógép kapacitás örvendetesen megnõtt az elmúlt másfél évben. Átadásra került egy 96-processzoros Sun HPC 10000 szuperszámítógép, két 16-processzoros Compaq Alpha Server gép, egy 58-processzoros PC klaszter és több kisebb PC klaszter. Mindezek különbözõ intézmények tulajdonában vannak és felhasználói körük folyamatosan bõvül. Azonban már az eddigi tapasztalatok is azt bizonyítják, hogy számos olyan alkalmazás létezik, melyek számításigénye túlmutat az egyedi szuperszámítógépek kapacitásán.


A projekt fõ célja ennek a problémának a megoldása oly módon, hogy az egyedi szuperszámítógépeket és klasztereket un. Gridbe kapcsoljuk a magyar akadémiai hálózat segítségével és ezzel az elérhetõ számítási kapacitást megsokszorozzuk. Világszerte számos hasonló nemzeti és nemzetközi projekt mûködik részben hasonló célokkal. Ezek közül több fontos projekttel (Condor, INFN Grid, UK e-science, DataGrid) és a két már korábban elindult magyar Grid projekttel (NI2000/08, DemoGrid) szorosan együtt kívánunk mûködni, ill. az eredményeikre támaszkodni kívánunk. Ugyanakkor a fenti projektekhez képest a jelen projekt célkitûzése lényeges eltér. A projektben létrehozandó Grid célja a szuperszámítógép kapacitás kiterjesztése a Gridre, ami a fenti projektekben nem, vagy csak mellékesen jelenik meg.


A fenti cél érdekében a Condort kívánjuk használni, mint Grid-szintû job kezelõ rendszert és a magyar fejlesztésû P-GRADE párhuzamos programfejlesztõ rendszerrel kívánjuk integrálni. Ennek eredményeképpen a felhasználók hasonló módon programozhatják a Grid rendszert, mint az egyedi szuperszámítógépeket és klasztereket.


A kialakítandó szuperszámítógép Grid réteges felépítésû lesz. A legfelsõ szinten a felhasználói programok jelennek meg. A projektben a kialakítandó Grid tesztelésére az MCNP (Monte Carlo N-Particle) nevû programot kívánjuk felhasználni, amelyet neutron-, gamma- és elektrontranszport feladatok megoldására fejlesztették ki a neutronfizika, reaktorfizika, sugárvédelem és nukleáris méréstechnika területén. A felhasználó egy Grid portálon keresztül éri el a Grid szolgáltatásait, melyek között szerepel a következõ szinten lévõ P-GRADE programfejlesztõ rendszer, melynek segítségével párhuzamosíthatja algoritmusait. A P-GRADE rendszer közvetlenül Condor jobot fog generálni, amely vagy PVM, vagy MPI programot tartalmazhat. A Condor job kezelõ az alatta lévõ Globus réteg segítségével osztja ki a párhuzamos programot a Grid erõforrásai között, amelyek a Grid legalsó rétegét képezik. Itt végül lokális ütemezõk (LSF, PBS, Condor, Sun Grid Engine) gondoskodnak a tényleges párhuzamos futtatásról. A fenti szintek kialakítása mellett a projekt feladata a Grid biztonságtechnikájának és gépidõ elszámolásának a megoldása is.