Slurm klaszter

Slurm referencia architektúra

 

Áttekintés:

A Slurm az egy nyílt forráskódú, hibatűrő és jól skálázható klaszterkezelő és job ütemező rendszer, melyet kis- illetve nagyméretű Linux alapú fürtökhöz készítettek. A Slurm működéséhez nincs szükség kernelmódosításokra és többnyire önállóan működik. Mint workload menedzser, a Slurm három fő funkcióval rendelkezik:

  • Az erőforrásokhoz (compute node-ok / worker-ek) kizárólagos vagy nem kizárólagos hozzáférést rendel a felhasználók számára a munkavégzés idejére.
  • Kész megoldást kínál az allokált node-ok halmazán (általában párhuzamos módon) a munka kezdeti, végrehajtási és monitorozási fázisában egyaránt.
  • Különválasztja az erőforrásokért folyó vitát a folyamatban lévő munka kezelésétől.
     

 

Használati és telepítési útmutató:

https://occopus.readthedocs.io/en/latest/tutorial-building-clusters.html#slurm-cluster