Szuperszámítógépek a statisztika tükrében

Telbisz Ferenc

KFKI RMKI Számítógép Hálózati Központ és MATÁV PKI-FI

Bevezetés

Az informatika területén kevés rendszeres, áttekintõ statisztika áll rendelkezésre. Ez alól kivétel a számítástechnika csúcsát jelentõ szuperszámítógepek területe, ahol közel egy évtizedre visszamenõleg, 1993 júniusától kezdve rendelkezésre áll a TOP500 lista, amely tartalmazza az 500 legnagyobb teljesítményû szuperszámítógépet. [1] Jelen elõadás elsõsorban ezen statisztika alapján tutoriális jelleggel ismerteti ezen felmérések eredményeit.

A szuperszámítógép fogalma.

Szuperszámítógépnek nevezzük azokat a nagyteljesítményû számítógépeket, ill. számítás­technikai rendszereket, amelyek teljesítménye néhány nagyságrenddel nagyobb, mint egy átlagos szerver vagy egy nagyteljesítményû munkaállomás. Jelen vizsgálódásban a világ 500 legnagyob teljesítményû számítógépét vesszük tekintetbe, noha ennél kisebb teljesítményû rendszerek is bízvást tekinthetõk szuperszámítógépnek.

  1. Ábra. A teljesítmény növekedése

A szuperszámítógép kategória idõben meglehetõsen gorsan változik, mind a felsõ, mind az alsó határa gyorsan növekszik. (1. Ábra.) Ezen idõszak alatt mind az összteljesítmény, mind a legnagyobb, mind pedig a listán szereplõ legkisebb rendszer teljesítménye kb. két nagyságrenddel nõtt, a listán szereplõ elsõ és utolsó rendszeré kb. évente 1.9-2.0 szeresére, az összteljesítmény pedig évente mintegy 1.7-szeresére nõtt meglehetõsen egyenletes ütemben.

Architektúra, processzor típus

A szuperszámítógép teljesítményt csak valamilyen párhuzamosság segítségével lehet elérni. Régebben a szuperszámítógépekben általában SIMD architektúrát (Sigle Instruction Multiple Data) használtak, amelyben ugyanolyan processzorok párhuzamosan hajtották végre ugyanazt az utasítást több adaton. A SIMD architektúra speciális esete a vektorprocesszor, amikor hasonló adatok tömbjén és nem egyedi adatokon végzik a mûveleteket speciálisan kialakított CPU-k. Ma már általában MIMD architektúrát használnak, ahol több különbözõ utasítás hajtódik végre párhuzamosan különbözõ adatokon. Ezek a processzorok a megszokott tipusú "skalár" processzorok, gyakran akár közönséges kommerciális processzorok. Mig a vizsgált idõszak elején a vektor processzorok adták a szuperszámítógépek zömét, ma már meglehetõsen visszaszorultak. (2. Ábra.)

  1. Ábra. Processzor típus

A szuperszámítógépek gyártói

A szuperszámítógépek döntõ többségét az Egyesült államokban gyártják, egy kisebb részét Japánban. Japán részesedése azonban a vizsgált idõszakban monoton csökkent. Míg 1993-ban a részesedése 20% fölött volt, ez 2001-re 10% alá csökkent. Európa részesedése a gyártásban lényegében elhanyagolható. Míg a vizsgált periódus elején még 2-3%-ban részt vett a TOP500 kategóriájú gépek gyártásában, 1996 után ez megszûnt.

Sokkal változatosabb képet mutat, ha a gépeknek a gyártók szerinti eloszlását nézzük, mivel gyártók ill. az általuk gyártott gépek megjelennek, ill. eltûnnek.a statisztikából. Kissé eltérõ a gyártók részesedése aszerint is, hogy az általuk gyártott gépek darabszámát, összteljesítményét vagy csúcsteljesítményét vizsgáljuk. Ez az arányokat látható módon megváltoztatja, mint az a 2001 évi novemberi adatokon látszik. (3. Ábra.)

  1. Ábra. A gyártók részesedése, 2001. November

Ez a sorrend megváltozását, a pozíciók néhány hellyel való változását jelenti, mint az ugyanezen adatokon látható (1. Táblázat), alapvetõ változást az egyes gyártók súlyában azonban nem jelent. A különbözõ teljesítmény részben az eltérõ architektúráknak a következménye.

  1. Táblázat. Sorrendváltozások

Installációk szerint rendezve

Rmax szerint rendezve

Rpeak szerint rendezve

IBM

IBM

IBM

Hewlett-Packard

Hewlett-Packard

Hewlett-Packard

SGI

Cray Inc.

SGI

Cray Inc.

SGI

Cray Inc.

Sun

Compaq

Sun

Fujitsu

Hitachi

Fujitsu

Compaq

Egyéb

Compaq

NEC

Fujitsu

NEC

Hitachi

Sun

Hitachi

Egyéb

NEC

Egyéb



A 4. és 5. Ábrákon bemutatjuk a különbözõ gyártók részesedését installáció szám és teljesítmény szerint.

  1. Ábra. Rendszerek gyártók szerint

A Cray és SGI részesedésének megállapításánál zavaró tényezõ az, hogy bár a Cray gépeket egy idöben az SGI cég gyártotta, – felvásárolta, majd késõbb eladta a Cray részleget – de ezen idõszakban is voltak olyan korábbi intallációk, amelyek még Cray néven szerepelnek.

  1. Ábra. A számítógépgyártók gépeinek teljesítménye

A szuperszámítógépek használói

A szuperszámítógépek legnagyobb felhasználója az ipar, amely részesedését a vizsgált idõszakban 27%-ról 52%-ra növelte, ami az installációk számát illeti. További két nagy felhasználó terület az egyetemek (academic) és az ipari felhasználás, azonban mindkettõ részesedése csökkent a vizsgált idõszakban. ( 6. Ábra.).

  1. Ábra. Installációk aránya ágazatonként

Ami a teljesítményt illeti, némileg más arányokat találunk. A kutatás változatlanul a legnagyobb felhasználó a teljesítményt illetõen. (7. Ábra) Az egyetemek (academic) részesedése ugyan alig nõtt a vizsgált idõszakban, de az összteljesítmény 219 MFlops-ról 29.2 GFlops-ra, több mint százszorosára nõtt. Hasonló jelentõs teljesítmény növekedés volt a kutatás területén: 592 MFlops-ról 57.7 GFlops-ra, annak ellenére, hogy a teljesítmény részesedése csökkent. Ezen két ábra egyrészt azt mutatja, hogy az ipar is egyre nagyobb mértékben kezdi használni a szuperszámítõgépeket, másrészt azt, hogy az iparban általában kevésbbé nagyteljesítményû gépeket használnak. (Bár az összes teljesítmény az iparban is 171 MFlops-ról 38.2 GFlops-ra nõtt.) Ez érhetõ is, ha meggondoljuk, hogy a legnagyobb teljesítményû gépek az u.n. "grand challenge" feladatokhoz kellenek, mint pl. a légkör és oceán modellezés, vagy a human genom program.

Az ipari felhasználásnál meg lehet vizsgálni a legnagyobb felhasználókat, ill. ezek részesedési arányát. Sajnos, a legtöbb installációnál nem állapítható meg a felhasználási terület, vélhetõen azért, mert nem lévén egyik sem domináns, nem adták (nem adható) meg. Egyszerûség kedvéért nagy felhasználónak tekintettem azokat a területeket, amelyek rendszeresen szerepeltek a nyolc legnagyobb felhasználó terület között, – a minták több mint felében – és ezeket tüntettem fel az ábrán. (8. Ábra)

  1. Ábra. A teljesítmény megoszlása

Az ábrán látható, hogy a vizsgált idõszakban a hagyományos szuperszámítógép felhasználási területnek számító repülés és ûrkutatás (aerospace), jármûgyártás, geofizika vala­melyest visszaszorult, viszont az adatbázis kezelés és pénzügyi alkalmazások elõre törtek, de leglátványosabb a távközlés elõretörése, amely az idöszak elején nem is szerepelt, de 2001-re a legnagyobb szuperszámítógép felhasználóvá vált. Az idõjárás kutatásának részesedése lényegében nem változott.

  1. Ábra. A legnagyobb felhasználások területén installált gépek száma.

A szuperszámítógépek földrajzi eloszlása

A szuperszámtítógépek regionális eloszlását az Északamerikai régió (USA–Kanada) dominanciája jellemzi, (kb. 50%) Európa részesedési aránya Japán rovására növekedett (9. Ábra) Egyébként a fejlett országoknak ugyanolyan túlsúlya látszik, mint az egyéb informatikai infrastruktúra terén [2], messze meghaladva ezen országoknak nemcsak területi, hanem népességi súlyát. Ez egyértelmûen a különbözõ területeket jellemzõ GDP-vel függ össze.

  1. Ábra. A szuperszámítógépek regionális eloszlása

Cluster-ek

A szuperszámítógépekrõl ma már nem lehet szólni a cluster-ek nélkül. A lokális hálózattal összekötött munkaállomások és PC-k szinte robbanásszerûen terjednek az elsõ Beowulf cluster megjelenés óta (1994). A terjedésüknek oka a (potenciálisan) olcsó hardver és szoftver, valamint az, hogy az építõk és a felhasználók közvetlenül kézben tarthatják a rendszert. A cluster-ek terjedése felkeltette a gyártók figyelmét is, és ma már többé-kevésbbé "konyhakész" állapotban is hozzájuthat ilyen rendszerhez az is, aki nem akar a rendszerépítéssel bajlódni.

A cluster-ek terjedését az is mutatja, hogy rendszeres nyilvántartásuk is megkezdõdött a TOP500 keretében [3], bár a statisztika alighanem messze nem teljes. Elterjedtségüket a 10. Ábra mutatja. A rendszereknek kb. 1/3-a saját összeállítású, kb. 1/3-át valamilyen integrátor szervezet (pl. 5% IBM) állította össze, a többirõl nincs információ. A rendszerek 90%-ban Linux operációs rendszerrel mûködnek, 4%-ban Soláris, 2% Windows NT van. A felhasználók 28%-a egyetem, 2%-a kutatás, a többirõl nincs információ. Néhány rendszer (5 db.) teljesítménye meghaladja az 1 Gflops-ot, 7 rendszer teljesítménye 500 MFlops és 1 GFlops között van.

Összefoglalás

Bár a TOP500 statisztika csak a "jéghegy csúcsát" rögzíti, mégis jó áttekintést ad arról a területrõl, amit HPC-nek (High Performance Computing) nevezünk. Megállapítható, hogy bár az installációk több mint fele ipari területen található, a teljesítménynek közel 2/3-a (64.4%) egyetemi és kutatási területen mûködik. A cluster-ek teljesítménye 2001-ben elérte azt az értéket, ahonnan a TOP500 lista 1994-ben indult

  1. Ábra. A cluster-ek elterjedtsége

Irodalom

  1. TOP500 Supercomputer Sites (http://www.top500.org/)

  2. BGP Geopolitical Analysis, Cooperative Association for Internet Data Analysis, (http://www.caida.org/analysis/geopolitical/bgp2country/)

  3. Clusters @ TOP500 - Top Clusters (http://clusters.top500.org/db/)

EHU-6-HPCstat 02.02.17 12.40