[Hpc-forum] Minden gép - Re: Budapesti gép

etele molnar etele.molnar at gmail.com
2014. Jan. 28., K, 11:42:56 CET


Emberek!


hasonlo a helyezet a debreceni gepen is, valakik "exlusive resorce"-t 
kertek tobb nodra. Ilyen volt a minap szegeden is.
Ezen valtoztatni kellene mert ha minden molnar a sajat malmara hajtja a 
vizet ;-) , akkor egyeseknek jut masoknak nem.

Itt szamszeruleg vegyuk a dolgokat: mostanaban peldaul van tobb 
100-jobom ami openmp -t es mpi-t hasznal,
a jobok altagban 2 - 24 ora alatt futtnak le mondjuk 6, 9  vagy 12 
cpu-magon.
Termeszetesen ha sajat rendeklezesemre all(na) 200-300 cpu akkor 3-4 nap 
alatt befejezem a munkat es johet a tanc,
de mivel eleg gyakran szaturaltak a gepek igy folyamatosan kell lesnem, 
hogy mikor kuldjek be ujabb jobokat,
azert hogy a queue-ben se legyen tobb 100-job, de igy pontosan 2-3 hetig 
tart a melo (olyan jo magyarosan).

A problema szerintem ott van, hogy a jelenlegi FIFO rendszer nem elegge 
"demokratikus", es figyelmen kivul hagyja azt, hogy vannak
jobok melyek par-orasak de olyanok is, hogy hetek kellenek (mindket 
esetben azonos szamu cpu hasznalataval)
Ez persze nem baj, sot ezt a kiindulopont, vagyis mindket queue-t, a 
serial.q es parallel.q-t fel kellene osztani rovid es hosszabb
futasi idot engedelyezo egysegekre (pl sparallel.q es lparralel.q a 
short es long-bol), peldaul  2/3 - 1/3 aranyban, vagy ami szukseges a 
felhasznaloknak.
Ezeket az aranyokat a rendszergazdak az eddigi logokbol barmikor meg 
tudjak mondani de ha megsem akkor mindig lehet parasztosan < 24h
es > 24h osztani, es majd finomhangolni a node-ok szamat is.

Ha ezt a felhasznalok tobbsege is esszerunek talalja akkor megerne egy 
probat peldaul a kovetkezo karbantartas ideje alatt el is lehet(ne) vegezni.

udv
e






On 1/28/2014 8:57 AM, jeszenoi at caesar.elte.hu wrote:
> Kedves Mindenki!
>
> Mi az oka hogy a budapesti gépen már egy jó ideje nem indul el 
> egyetlen futásom sem (és ahogyan nézem másoknak is)? 30 üres node van 
> jelenleg. A még régebben (hónap elején) indított jobjaim lefutottak 
> rendben, de újabbakat csak a szegedi, vagy a debreceni gépre tudok 
> elküldeni. Az sbalance szerint a limitem 0 óra, gondolom emiatt nem 
> indul el semmim, de a többi gépen akkor miért sikerül minden? Nem 
> igazán világos nekem a dolog.
>
> üdv:




További információk a(z) Hpc-forum levelezőlistáról