[Hpc-forum] Minden gép - Re: Budapesti gép
etele molnar
etele.molnar at gmail.com
2014. Jan. 28., K, 11:42:56 CET
Emberek!
hasonlo a helyezet a debreceni gepen is, valakik "exlusive resorce"-t
kertek tobb nodra. Ilyen volt a minap szegeden is.
Ezen valtoztatni kellene mert ha minden molnar a sajat malmara hajtja a
vizet ;-) , akkor egyeseknek jut masoknak nem.
Itt szamszeruleg vegyuk a dolgokat: mostanaban peldaul van tobb
100-jobom ami openmp -t es mpi-t hasznal,
a jobok altagban 2 - 24 ora alatt futtnak le mondjuk 6, 9 vagy 12
cpu-magon.
Termeszetesen ha sajat rendeklezesemre all(na) 200-300 cpu akkor 3-4 nap
alatt befejezem a munkat es johet a tanc,
de mivel eleg gyakran szaturaltak a gepek igy folyamatosan kell lesnem,
hogy mikor kuldjek be ujabb jobokat,
azert hogy a queue-ben se legyen tobb 100-job, de igy pontosan 2-3 hetig
tart a melo (olyan jo magyarosan).
A problema szerintem ott van, hogy a jelenlegi FIFO rendszer nem elegge
"demokratikus", es figyelmen kivul hagyja azt, hogy vannak
jobok melyek par-orasak de olyanok is, hogy hetek kellenek (mindket
esetben azonos szamu cpu hasznalataval)
Ez persze nem baj, sot ezt a kiindulopont, vagyis mindket queue-t, a
serial.q es parallel.q-t fel kellene osztani rovid es hosszabb
futasi idot engedelyezo egysegekre (pl sparallel.q es lparralel.q a
short es long-bol), peldaul 2/3 - 1/3 aranyban, vagy ami szukseges a
felhasznaloknak.
Ezeket az aranyokat a rendszergazdak az eddigi logokbol barmikor meg
tudjak mondani de ha megsem akkor mindig lehet parasztosan < 24h
es > 24h osztani, es majd finomhangolni a node-ok szamat is.
Ha ezt a felhasznalok tobbsege is esszerunek talalja akkor megerne egy
probat peldaul a kovetkezo karbantartas ideje alatt el is lehet(ne) vegezni.
udv
e
On 1/28/2014 8:57 AM, jeszenoi at caesar.elte.hu wrote:
> Kedves Mindenki!
>
> Mi az oka hogy a budapesti gépen már egy jó ideje nem indul el
> egyetlen futásom sem (és ahogyan nézem másoknak is)? 30 üres node van
> jelenleg. A még régebben (hónap elején) indított jobjaim lefutottak
> rendben, de újabbakat csak a szegedi, vagy a debreceni gépre tudok
> elküldeni. Az sbalance szerint a limitem 0 óra, gondolom emiatt nem
> indul el semmim, de a többi gépen akkor miért sikerül minden? Nem
> igazán világos nekem a dolog.
>
> üdv:
További információk a(z) Hpc-forum levelezőlistáról