Szuperszámítógépek a statisztika tükrében

Telbisz Ferenc

KFKI RMKI Számítógép Hálózati Központ és MATÁV PKI-FI

Bevezetés

Az informatika területén kevés rendszeres, áttekintõ statisztika áll rendelkezésre. Ez alól kivétel a számítástechnika csúcsát jelentõ szuperszámítógepek területe, ahol közel egy évtizedre visszamenõleg, 1993 júniusától kezdve rendelkezésre áll a TOP500 lista, amely tartalmazza az 500 legnagyobb teljesítményû szuperszámítógépet. [1] Jelen elõadás elsõsorban ezen statisztika alapján tutoriális jelleggel ismerteti ezen felmérések eredményeit.

A szuperszámítógép fogalma.

Szuperszámítógépnek nevezzük azokat a nagyteljesítményû számítógépeket, ill. számítás­technikai rendszereket, amelyek teljesítménye néhány nagyságrenddel nagyobb, mint egy átlagos szerver vagy egy nagyteljesítményû munkaállomás. Jelen vizsgálódásban a világ 500 legnagyob teljesítményû számítógépét vesszük tekintetbe, noha ennél kisebb teljesítményû rendszerek is bízvást tekinthetõk szuperszámítógépnek.

 1. Ábra. A teljesítmény növekedése

A szuperszámítógép kategória idõben meglehetõsen gorsan változik, mind a felsõ, mind az alsó határa gyorsan növekszik. (1. Ábra.) Ezen idõszak alatt mind az összteljesítmény, mind a legnagyobb, mind pedig a listán szereplõ legkisebb rendszer teljesítménye kb. két nagyságrenddel nõtt, a listán szereplõ elsõ és utolsó rendszeré kb. évente 1.9-2.0 szeresére, az összteljesítmény pedig évente mintegy 1.7-szeresére nõtt meglehetõsen egyenletes ütemben.

Architektúra, processzor típus

A szuperszámítógép teljesítményt csak valamilyen párhuzamosság segítségével lehet elérni. Régebben a szuperszámítógépekben általában SIMD architektúrát (Sigle Instruction Multiple Data) használtak, amelyben ugyanolyan processzorok párhuzamosan hajtották végre ugyanazt az utasítást több adaton. A SIMD architektúra speciális esete a vektorprocesszor, amikor hasonló adatok tömbjén és nem egyedi adatokon végzik a mûveleteket speciálisan kialakított CPU-k. Ma már általában MIMD architektúrát használnak, ahol több különbözõ utasítás hajtódik végre párhuzamosan különbözõ adatokon. Ezek a processzorok a megszokott tipusú "skalár" processzorok, gyakran akár közönséges kommerciális processzorok. Mig a vizsgált idõszak elején a vektor processzorok adták a szuperszámítógépek zömét, ma már meglehetõsen visszaszorultak. (2. Ábra.)

 1. Ábra. Processzor típus

A szuperszámítógépek gyártói

A szuperszámítógépek döntõ többségét az Egyesült államokban gyártják, egy kisebb részét Japánban. Japán részesedése azonban a vizsgált idõszakban monoton csökkent. Míg 1993-ban a részesedése 20% fölött volt, ez 2001-re 10% alá csökkent. Európa részesedése a gyártásban lényegében elhanyagolható. Míg a vizsgált periódus elején még 2-3%-ban részt vett a TOP500 kategóriájú gépek gyártásában, 1996 után ez megszûnt.

Sokkal változatosabb képet mutat, ha a gépeknek a gyártók szerinti eloszlását nézzük, mivel gyártók ill. az általuk gyártott gépek megjelennek, ill. eltûnnek.a statisztikából. Kissé eltérõ a gyártók részesedése aszerint is, hogy az általuk gyártott gépek darabszámát, összteljesítményét vagy csúcsteljesítményét vizsgáljuk. Ez az arányokat látható módon megváltoztatja, mint az a 2001 évi novemberi adatokon látszik. (3. Ábra.)

 1. Ábra. A gyártók részesedése, 2001. November

Ez a sorrend megváltozását, a pozíciók néhány hellyel való változását jelenti, mint az ugyanezen adatokon látható (1. Táblázat), alapvetõ változást az egyes gyártók súlyában azonban nem jelent. A különbözõ teljesítmény részben az eltérõ architektúráknak a következménye.

 1. Táblázat. Sorrendváltozások

Installációk szerint rendezve

Rmax szerint rendezve

Rpeak szerint rendezve

IBM

IBM

IBM

Hewlett-Packard

Hewlett-Packard

Hewlett-Packard

SGI

Cray Inc.

SGI

Cray Inc.

SGI

Cray Inc.

Sun

Compaq

Sun

Fujitsu

Hitachi

Fujitsu

Compaq

Egyéb

Compaq

NEC

Fujitsu

NEC

Hitachi

Sun

Hitachi

Egyéb

NEC

EgyébA 4. és 5. Ábrákon bemutatjuk a különbözõ gyártók részesedését installáció szám és teljesítmény szerint.

 1. Ábra. Rendszerek gyártók szerint

A Cray és SGI részesedésének megállapításánál zavaró tényezõ az, hogy bár a Cray gépeket egy idöben az SGI cég gyártotta, – felvásárolta, majd késõbb eladta a Cray részleget – de ezen idõszakban is voltak olyan korábbi intallációk, amelyek még Cray néven szerepelnek.

 1. Ábra. A számítógépgyártók gépeinek teljesítménye

A szuperszámítógépek használói

A szuperszámítógépek legnagyobb felhasználója az ipar, amely részesedését a vizsgált idõszakban 27%-ról 52%-ra növelte, ami az installációk számát illeti. További két nagy felhasználó terület az egyetemek (academic) és az ipari felhasználás, azonban mindkettõ részesedése csökkent a vizsgált idõszakban. ( 6. Ábra.).

 1. Ábra. Installációk aránya ágazatonként

Ami a teljesítményt illeti, némileg más arányokat találunk. A kutatás változatlanul a legnagyobb felhasználó a teljesítményt illetõen. (7. Ábra) Az egyetemek (academic) részesedése ugyan alig nõtt a vizsgált idõszakban, de az összteljesítmény 219 MFlops-ról 29.2 GFlops-ra, több mint százszorosára nõtt. Hasonló jelentõs teljesítmény növekedés volt a kutatás területén: 592 MFlops-ról 57.7 GFlops-ra, annak ellenére, hogy a teljesítmény részesedése csökkent. Ezen két ábra egyrészt azt mutatja, hogy az ipar is egyre nagyobb mértékben kezdi használni a szuperszámítõgépeket, másrészt azt, hogy az iparban általában kevésbbé nagyteljesítményû gépeket használnak. (Bár az összes teljesítmény az iparban is 171 MFlops-ról 38.2 GFlops-ra nõtt.) Ez érhetõ is, ha meggondoljuk, hogy a legnagyobb teljesítményû gépek az u.n. "grand challenge" feladatokhoz kellenek, mint pl. a légkör és oceán modellezés, vagy a human genom program.

Az ipari felhasználásnál meg lehet vizsgálni a legnagyobb felhasználókat, ill. ezek részesedési arányát. Sajnos, a legtöbb installációnál nem állapítható meg a felhasználási terület, vélhetõen azért, mert nem lévén egyik sem domináns, nem adták (nem adható) meg. Egyszerûség kedvéért nagy felhasználónak tekintettem azokat a területeket, amelyek rendszeresen szerepeltek a nyolc legnagyobb felhasználó terület között, – a minták több mint felében – és ezeket tüntettem fel az ábrán. (8. Ábra)

 1. Ábra. A teljesítmény megoszlása

Az ábrán látható, hogy a vizsgált idõszakban a hagyományos szuperszámítógép felhasználási területnek számító repülés és ûrkutatás (aerospace), jármûgyártás, geofizika vala­melyest visszaszorult, viszont az adatbázis kezelés és pénzügyi alkalmazások elõre törtek, de leglátványosabb a távközlés elõretörése, amely az idöszak elején nem is szerepelt, de 2001-re a legnagyobb szuperszámítógép felhasználóvá vált. Az idõjárás kutatásának részesedése lényegében nem változott.

 1. Ábra. A legnagyobb felhasználások területén installált gépek száma.

A szuperszámítógépek földrajzi eloszlása

A szuperszámtítógépek regionális eloszlását az Északamerikai régió (USA–Kanada) dominanciája jellemzi, (kb. 50%) Európa részesedési aránya Japán rovására növekedett (9. Ábra) Egyébként a fejlett országoknak ugyanolyan túlsúlya látszik, mint az egyéb informatikai infrastruktúra terén [2], messze meghaladva ezen országoknak nemcsak területi, hanem népességi súlyát. Ez egyértelmûen a különbözõ területeket jellemzõ GDP-vel függ össze.

 1. Ábra. A szuperszámítógépek regionális eloszlása

Cluster-ek

A szuperszámítógépekrõl ma már nem lehet szólni a cluster-ek nélkül. A lokális hálózattal összekötött munkaállomások és PC-k szinte robbanásszerûen terjednek az elsõ Beowulf cluster megjelenés óta (1994). A terjedésüknek oka a (potenciálisan) olcsó hardver és szoftver, valamint az, hogy az építõk és a felhasználók közvetlenül kézben tarthatják a rendszert. A cluster-ek terjedése felkeltette a gyártók figyelmét is, és ma már többé-kevésbbé "konyhakész" állapotban is hozzájuthat ilyen rendszerhez az is, aki nem akar a rendszerépítéssel bajlódni.

A cluster-ek terjedését az is mutatja, hogy rendszeres nyilvántartásuk is megkezdõdött a TOP500 keretében [3], bár a statisztika alighanem messze nem teljes. Elterjedtségüket a 10. Ábra mutatja. A rendszereknek kb. 1/3-a saját összeállítású, kb. 1/3-át valamilyen integrátor szervezet (pl. 5% IBM) állította össze, a többirõl nincs információ. A rendszerek 90%-ban Linux operációs rendszerrel mûködnek, 4%-ban Soláris, 2% Windows NT van. A felhasználók 28%-a egyetem, 2%-a kutatás, a többirõl nincs információ. Néhány rendszer (5 db.) teljesítménye meghaladja az 1 Gflops-ot, 7 rendszer teljesítménye 500 MFlops és 1 GFlops között van.

Összefoglalás

Bár a TOP500 statisztika csak a "jéghegy csúcsát" rögzíti, mégis jó áttekintést ad arról a területrõl, amit HPC-nek (High Performance Computing) nevezünk. Megállapítható, hogy bár az installációk több mint fele ipari területen található, a teljesítménynek közel 2/3-a (64.4%) egyetemi és kutatási területen mûködik. A cluster-ek teljesítménye 2001-ben elérte azt az értéket, ahonnan a TOP500 lista 1994-ben indult

 1. Ábra. A cluster-ek elterjedtsége

Irodalom

 1. TOP500 Supercomputer Sites (http://www.top500.org/)

 2. BGP Geopolitical Analysis, Cooperative Association for Internet Data Analysis, (http://www.caida.org/analysis/geopolitical/bgp2country/)

 3. Clusters @ TOP500 - Top Clusters (http://clusters.top500.org/db/)

EHU-6-HPCstat 02.02.17 12.40