Szuperszámítógépek a statisztika tükrében
Telbisz Ferenc
KFKI RMKI Számítógép Hálózati Központ és MATÁV PKI-FI
Bevezetés
Az informatika területén kevés rendszeres, áttekintõ statisztika áll rendelkezésre. Ez alól kivétel a számítástechnika csúcsát jelentõ szuperszámítógepek területe, ahol közel egy évtizedre visszamenõleg, 1993 júniusától kezdve rendelkezésre áll a TOP500 lista, amely tartalmazza az 500 legnagyobb teljesítményû szuperszámítógépet. [1] Jelen elõadás elsõsorban ezen statisztika alapján tutoriális jelleggel ismerteti ezen felmérések eredményeit.
A szuperszámítógép fogalma.
Szuperszámítógépnek nevezzük azokat a nagyteljesítményû számítógépeket, ill. számítástechnikai rendszereket, amelyek teljesítménye néhány nagyságrenddel nagyobb, mint egy átlagos szerver vagy egy nagyteljesítményû munkaállomás. Jelen vizsgálódásban a világ 500 legnagyob teljesítményû számítógépét vesszük tekintetbe, noha ennél kisebb teljesítményû rendszerek is bízvást tekinthetõk szuperszámítógépnek.
Ábra. A teljesítmény növekedése
A szuperszámítógép kategória idõben meglehetõsen gorsan változik, mind a felsõ, mind az alsó határa gyorsan növekszik. (1. Ábra.) Ezen idõszak alatt mind az összteljesítmény, mind a legnagyobb, mind pedig a listán szereplõ legkisebb rendszer teljesítménye kb. két nagyságrenddel nõtt, a listán szereplõ elsõ és utolsó rendszeré kb. évente 1.9-2.0 szeresére, az összteljesítmény pedig évente mintegy 1.7-szeresére nõtt meglehetõsen egyenletes ütemben.
Architektúra, processzor típus
A szuperszámítógép teljesítményt csak valamilyen párhuzamosság segítségével lehet elérni. Régebben a szuperszámítógépekben általában SIMD architektúrát (Sigle Instruction Multiple Data) használtak, amelyben ugyanolyan processzorok párhuzamosan hajtották végre ugyanazt az utasítást több adaton. A SIMD architektúra speciális esete a vektorprocesszor, amikor hasonló adatok tömbjén és nem egyedi adatokon végzik a mûveleteket speciálisan kialakított CPU-k. Ma már általában MIMD architektúrát használnak, ahol több különbözõ utasítás hajtódik végre párhuzamosan különbözõ adatokon. Ezek a processzorok a megszokott tipusú "skalár" processzorok, gyakran akár közönséges kommerciális processzorok. Mig a vizsgált idõszak elején a vektor processzorok adták a szuperszámítógépek zömét, ma már meglehetõsen visszaszorultak. (2. Ábra.)
Ábra. Processzor típus
A szuperszámítógépek gyártói
A szuperszámítógépek döntõ többségét az Egyesült államokban gyártják, egy kisebb részét Japánban. Japán részesedése azonban a vizsgált idõszakban monoton csökkent. Míg 1993-ban a részesedése 20% fölött volt, ez 2001-re 10% alá csökkent. Európa részesedése a gyártásban lényegében elhanyagolható. Míg a vizsgált periódus elején még 2-3%-ban részt vett a TOP500 kategóriájú gépek gyártásában, 1996 után ez megszûnt.
Sokkal változatosabb képet mutat, ha a gépeknek a gyártók szerinti eloszlását nézzük, mivel gyártók ill. az általuk gyártott gépek megjelennek, ill. eltûnnek.a statisztikából. Kissé eltérõ a gyártók részesedése aszerint is, hogy az általuk gyártott gépek darabszámát, összteljesítményét vagy csúcsteljesítményét vizsgáljuk. Ez az arányokat látható módon megváltoztatja, mint az a 2001 évi novemberi adatokon látszik. (3. Ábra.)
Ábra. A gyártók részesedése, 2001. November
Ez a sorrend megváltozását, a pozíciók néhány hellyel való változását jelenti, mint az ugyanezen adatokon látható (1. Táblázat), alapvetõ változást az egyes gyártók súlyában azonban nem jelent. A különbözõ teljesítmény részben az eltérõ architektúráknak a következménye.
Táblázat. Sorrendváltozások
Installációk szerint rendezve |
Rmax szerint rendezve |
Rpeak szerint rendezve |
IBM |
IBM |
IBM |
Hewlett-Packard |
Hewlett-Packard |
Hewlett-Packard |
SGI |
Cray Inc. |
SGI |
Cray Inc. |
SGI |
Cray Inc. |
Sun |
Compaq |
Sun |
Fujitsu |
Hitachi |
Fujitsu |
Compaq |
Egyéb |
Compaq |
NEC |
Fujitsu |
NEC |
Hitachi |
Sun |
Hitachi |
Egyéb |
NEC |
Egyéb |
A 4. és 5. Ábrákon bemutatjuk a különbözõ gyártók részesedését installáció szám és teljesítmény szerint.
Ábra. Rendszerek gyártók szerint
A Cray és SGI részesedésének megállapításánál zavaró tényezõ az, hogy bár a Cray gépeket egy idöben az SGI cég gyártotta, felvásárolta, majd késõbb eladta a Cray részleget de ezen idõszakban is voltak olyan korábbi intallációk, amelyek még Cray néven szerepelnek.
Ábra. A számítógépgyártók gépeinek teljesítménye
A szuperszámítógépek használói
A szuperszámítógépek legnagyobb felhasználója az ipar, amely részesedését a vizsgált idõszakban 27%-ról 52%-ra növelte, ami az installációk számát illeti. További két nagy felhasználó terület az egyetemek (academic) és az ipari felhasználás, azonban mindkettõ részesedése csökkent a vizsgált idõszakban. ( 6. Ábra.).
Ábra. Installációk aránya ágazatonként
Ami a teljesítményt illeti, némileg más arányokat találunk. A kutatás változatlanul a legnagyobb felhasználó a teljesítményt illetõen. (7. Ábra) Az egyetemek (academic) részesedése ugyan alig nõtt a vizsgált idõszakban, de az összteljesítmény 219 MFlops-ról 29.2 GFlops-ra, több mint százszorosára nõtt. Hasonló jelentõs teljesítmény növekedés volt a kutatás területén: 592 MFlops-ról 57.7 GFlops-ra, annak ellenére, hogy a teljesítmény részesedése csökkent. Ezen két ábra egyrészt azt mutatja, hogy az ipar is egyre nagyobb mértékben kezdi használni a szuperszámítõgépeket, másrészt azt, hogy az iparban általában kevésbbé nagyteljesítményû gépeket használnak. (Bár az összes teljesítmény az iparban is 171 MFlops-ról 38.2 GFlops-ra nõtt.) Ez érhetõ is, ha meggondoljuk, hogy a legnagyobb teljesítményû gépek az u.n. "grand challenge" feladatokhoz kellenek, mint pl. a légkör és oceán modellezés, vagy a human genom program.
Az ipari felhasználásnál meg lehet vizsgálni a legnagyobb felhasználókat, ill. ezek részesedési arányát. Sajnos, a legtöbb installációnál nem állapítható meg a felhasználási terület, vélhetõen azért, mert nem lévén egyik sem domináns, nem adták (nem adható) meg. Egyszerûség kedvéért nagy felhasználónak tekintettem azokat a területeket, amelyek rendszeresen szerepeltek a nyolc legnagyobb felhasználó terület között, a minták több mint felében és ezeket tüntettem fel az ábrán. (8. Ábra)
Ábra. A teljesítmény megoszlása
Az ábrán látható, hogy a vizsgált idõszakban a hagyományos szuperszámítógép felhasználási területnek számító repülés és ûrkutatás (aerospace), jármûgyártás, geofizika valamelyest visszaszorult, viszont az adatbázis kezelés és pénzügyi alkalmazások elõre törtek, de leglátványosabb a távközlés elõretörése, amely az idöszak elején nem is szerepelt, de 2001-re a legnagyobb szuperszámítógép felhasználóvá vált. Az idõjárás kutatásának részesedése lényegében nem változott.
Ábra. A legnagyobb felhasználások területén installált gépek száma.
A szuperszámítógépek földrajzi eloszlása
A szuperszámtítógépek regionális eloszlását az Északamerikai régió (USAKanada) dominanciája jellemzi, (kb. 50%) Európa részesedési aránya Japán rovására növekedett (9. Ábra) Egyébként a fejlett országoknak ugyanolyan túlsúlya látszik, mint az egyéb informatikai infrastruktúra terén [2], messze meghaladva ezen országoknak nemcsak területi, hanem népességi súlyát. Ez egyértelmûen a különbözõ területeket jellemzõ GDP-vel függ össze.
Ábra. A szuperszámítógépek regionális eloszlása
Cluster-ek
A szuperszámítógépekrõl ma már nem lehet szólni a cluster-ek nélkül. A lokális hálózattal összekötött munkaállomások és PC-k szinte robbanásszerûen terjednek az elsõ Beowulf cluster megjelenés óta (1994). A terjedésüknek oka a (potenciálisan) olcsó hardver és szoftver, valamint az, hogy az építõk és a felhasználók közvetlenül kézben tarthatják a rendszert. A cluster-ek terjedése felkeltette a gyártók figyelmét is, és ma már többé-kevésbbé "konyhakész" állapotban is hozzájuthat ilyen rendszerhez az is, aki nem akar a rendszerépítéssel bajlódni.
A cluster-ek terjedését az is mutatja, hogy rendszeres nyilvántartásuk is megkezdõdött a TOP500 keretében [3], bár a statisztika alighanem messze nem teljes. Elterjedtségüket a 10. Ábra mutatja. A rendszereknek kb. 1/3-a saját összeállítású, kb. 1/3-át valamilyen integrátor szervezet (pl. 5% IBM) állította össze, a többirõl nincs információ. A rendszerek 90%-ban Linux operációs rendszerrel mûködnek, 4%-ban Soláris, 2% Windows NT van. A felhasználók 28%-a egyetem, 2%-a kutatás, a többirõl nincs információ. Néhány rendszer (5 db.) teljesítménye meghaladja az 1 Gflops-ot, 7 rendszer teljesítménye 500 MFlops és 1 GFlops között van.
Összefoglalás
Bár a TOP500 statisztika csak a "jéghegy csúcsát" rögzíti, mégis jó áttekintést ad arról a területrõl, amit HPC-nek (High Performance Computing) nevezünk. Megállapítható, hogy bár az installációk több mint fele ipari területen található, a teljesítménynek közel 2/3-a (64.4%) egyetemi és kutatási területen mûködik. A cluster-ek teljesítménye 2001-ben elérte azt az értéket, ahonnan a TOP500 lista 1994-ben indult
Ábra. A cluster-ek elterjedtsége
Irodalom
TOP500 Supercomputer Sites (http://www.top500.org/)
BGP Geopolitical Analysis, Cooperative Association for Internet Data Analysis, (http://www.caida.org/analysis/geopolitical/bgp2country/)
Clusters @ TOP500 - Top Clusters (http://clusters.top500.org/db/)
EHU-6-HPCstat 02.02.17 12.40