[Hpc-forum] Minden gép - Re: Budapesti gép
Gábor Rőczei
roczei at niif.hu
2014. Feb. 5., Sze, 19:58:46 CET
Kedves Etele!
2014.01.28. dátummal, 11:42 időpontban etele molnar <etele.molnar at gmail.com> írta:
> Emberek!
>
>
> hasonlo a helyezet a debreceni gepen is, valakik "exlusive resorce"-t kertek tobb nodra. Ilyen volt a minap szegeden is.
> Ezen valtoztatni kellene mert ha minden molnar a sajat malmara hajtja a vizet ;-) , akkor egyeseknek jut masoknak nem.
>
> Itt szamszeruleg vegyuk a dolgokat: mostanaban peldaul van tobb 100-jobom ami openmp -t es mpi-t hasznal,
> a jobok altagban 2 - 24 ora alatt futtnak le mondjuk 6, 9 vagy 12 cpu-magon.
> Termeszetesen ha sajat rendeklezesemre all(na) 200-300 cpu akkor 3-4 nap alatt befejezem a munkat es johet a tanc,
> de mivel eleg gyakran szaturaltak a gepek igy folyamatosan kell lesnem, hogy mikor kuldjek be ujabb jobokat,
> azert hogy a queue-ben se legyen tobb 100-job, de igy pontosan 2-3 hetig tart a melo (olyan jo magyarosan).
>
> A problema szerintem ott van, hogy a jelenlegi FIFO rendszer nem elegge "demokratikus", es figyelmen kivul hagyja azt, hogy vannak
> jobok melyek par-orasak de olyanok is, hogy hetek kellenek (mindket esetben azonos szamu cpu hasznalataval)
> Ez persze nem baj, sot ezt a kiindulopont, vagyis mindket queue-t, a serial.q es parallel.q-t fel kellene osztani rovid es hosszabb
> futasi idot engedelyezo egysegekre (pl sparallel.q es lparralel.q a short es long-bol), peldaul 2/3 - 1/3 aranyban, vagy ami szukseges a felhasznaloknak.
> Ezeket az aranyokat a rendszergazdak az eddigi logokbol barmikor meg tudjak mondani de ha megsem akkor mindig lehet parasztosan < 24h
> es > 24h osztani, es majd finomhangolni a node-ok szamat is.
>
> Ha ezt a felhasznalok tobbsege is esszerunek talalja akkor megerne egy probat peldaul a kovetkezo karbantartas ideje alatt el is lehet(ne) vegezni.
Ez már részben meg van csinálva. A végleges megoldás az lesz, hogy mindenhol SLURM ütemezőt fogunk bevezetni. Ebben ugyanis sokkal kifinomultabb megoldások léteznek mint az SGE-ben.
Jelenleg Szegeden a szegedi projektek, pécsen a pécsi projektek, debrecenben a debreceni projektek kapnak nagyobb prioritást az SGE várakozó sorokban. A qstat kimenetében a jobhoz tartozó prioritás érték a “prior” oszlopban található:
job-ID prior name user state submit/start at queue slots ja-task-ID
Ennek elsősorban addig van szerepe amíg a job el nem indul.
Funkcionális ütemezés van beállítva nálunk, ami egyszerűen fogalmazva annyit jelent hogy ticket-ek osztunk szét a felhasználóknak és a projekteknek. A döntéseket elsődlegesen a projektek szintjén hozzá meg az SGE. Itt van egy rövid magyarázat a funkcionális ütemezésről:
http://www.gridengine.info/2005/09/30/pretty-pictures-explain-functional-vs-sharetree-scheduling/
Azt is figyelembe veszi, hogy az egyes felhasználóknak éppen mennyi futó jobja van és ennek függvényében fog elfogyni a saját ticket-jük. Továbbá az SGE azt is vizsgálja, hogy egy job milyen régóta van a várakozó sorban és ha régebben van mint a többi akkor nagyobb lesz a prioritása.
Például van két projektünk: A illetve B és most Debrecenben vagyunk
Az A projekt jobjai nagyobb prioritást fognak kapni Debrecenben amikor a hozzá tartozó qw (el nem indult) állapotú jobokat ki fogja választani az ütemező, mint a B projekt jobjai. Oka: a B projekt szegedi és ezért ők Debrecenben nem kapnak nagyobb prioritást.
DEBRECEN[service0] ~ (0)$ getent group B
B:*:2000:judit
DEBRECEN[service0] ~ (0)$ getent group A
A:*:3000:andras,janos,tamas,zoli
DEBRECEN[service0] ~ (0)$ qconf -sprj A
name A
oticket 0
fshare 1000
acl A
xacl NONE
DEBRECEN[service0] ~ (0)$ qconf -sprj B
name B
oticket 0
fshare 100
acl B
xacl NONE
DEBRECEN[service0] ~ (0)$
A Judit féle jobok a B projekthez fognak tartozni és annak csak 100 a fshare értéke. Andrásék jobjai pedig az A projekthez fognak tartozni, aminek viszont 1000 az fshare értéke, mivel debreceni projektről van szó. Ezért Andrásék jobjai hamarabb fognak elindulni, mert 1000 nagyobb mint a 100. Így most már láthatjátok, hogy az SGE-ben hogyan van ez beállítva. Remélem, hogy ez segít abban, hogy jobban megértsétek az ütemezés jelenlegi működését.
Ha valami nem világos akkor írjatok nyugodtan. Annyi lenne a kérésem, hogy maradjon CC-ben a hpc-forum lista.
Gábor
További információk a(z) Hpc-forum levelezőlistáról