A slurm HPC ütemező

Hornos Tamás dr. <>
NIIF Intézet

A Slurm egy nagyteljesítményű számítógéprendszerekre kifejlesztett ingyenes ütemező rendszer. A következő funkcionalitásokat valósítja meg: i) az elérhető számítási erőforrások hozzáférésének szabályozása, ii) párhuzamos és soros programok futtatásához segédeszközök, iii) sorkezelő funkiciók. Moduláris, kliens-szerver architektúrával és kifinomult, prioritás alapú sorkezelővel rendelkezik. A legnagyobb szuperszámítógépektől az asztali munkaállomásokig többféle hardware platformot támogat. Jelenleg több a Top500-as listában szereplő szuperszámítógépen is használatban van.

Előadásomban bemutatom a Slurm ütemező fő komponenseit: i) a modern többmagos processzorokat és gyorsító kártyákat is támogató sorkezelő rendszert, ii) a felhasználói elszámoló rendszert, amely támogatja a több klaszteres üzemmódot is. Ebben az üzmemmódban a Slurm képes egy helyről irányítani több klasztert. Be fogom mutatni, hogy az NIIF szuperszámítógépeit hogyan lehet ilyen több klaszteres módban üzemeltetni.

https://computing.llnl.gov/linux/slurm