[Hpc-forum] Minden gép - Re: Budapesti gép [Caution: Message contains Redirect URL content]

Ferenc Bartha barthaf at sol.cc.u-szeged.hu
2014. Jan. 28., K, 12:06:37 CET


Kedves Etele!

Egyetertek azzal, hogy exclusive futast csak az kerjen, aki teljes 
node-o(ka)t foglal az MPI-s job-jaival es nem szeretne szetszorodni a 
gepeken. Ez akkor a tobbiek job-jait nem erinti, az eroforrasokat nem 
vesztegeti, onvedelem.

Valami felreertes megis lehet a leveledben. Gyakorta ellenorzom a terhelest 
es szolok, ha tartosan es jelentosen kihasznalatlan (vagy eppen tulterhelt) 
a gep nem jol elkuldott job-ok miatt. Most ilyet nem latok, pl Szegeden a 
qhost szerint szepen (csaknem dugig) mennek a node-ok. Debrecenben sem mas a 
helyzet.

A queue igazsagtalansagarol irottak orokzold problema, ezen nem lehet 
altalanos szabalyokkal segiteni. Csak kezi erovel emberi bolcsesseggel, de 
abbol ujabb felhaborodas lesz.

ÜdvFeri
------------:
Dr. Ferenc BARTHA, tel: 62/54-6821, E-mail: barthaf at sol.cc.u-szeged.hu
SKYPE: ferenc.bartha, WWW: http://www.staff.u-szeged.hu/~barthaf/
SZTE DNT - High Performance Computing Group, 6725 Szeged, Szikra u. 2.
SZTE, Department of Medical Chemistry, 6720 Szeged, Dóm tér 8.

----- Original Message ----- 
From: "etele molnar" <etele.molnar at gmail.com>
To: <jeszenoi at caesar.elte.hu>; <hpc-forum at listserv.niif.hu>
Sent: Tuesday, January 28, 2014 11:42 AM
Subject: [Hpc-forum] Minden gép - Re: Budapesti gép [Caution: Message 
contains Redirect URL content]


Emberek!


hasonlo a helyezet a debreceni gepen is, valakik "exlusive resorce"-t
kertek tobb nodra. Ilyen volt a minap szegeden is.
Ezen valtoztatni kellene mert ha minden molnar a sajat malmara hajtja a
vizet ;-) , akkor egyeseknek jut masoknak nem.

Itt szamszeruleg vegyuk a dolgokat: mostanaban peldaul van tobb
100-jobom ami openmp -t es mpi-t hasznal,
a jobok altagban 2 - 24 ora alatt futtnak le mondjuk 6, 9  vagy 12
cpu-magon.
Termeszetesen ha sajat rendeklezesemre all(na) 200-300 cpu akkor 3-4 nap
alatt befejezem a munkat es johet a tanc,
de mivel eleg gyakran szaturaltak a gepek igy folyamatosan kell lesnem,
hogy mikor kuldjek be ujabb jobokat,
azert hogy a queue-ben se legyen tobb 100-job, de igy pontosan 2-3 hetig
tart a melo (olyan jo magyarosan).

A problema szerintem ott van, hogy a jelenlegi FIFO rendszer nem elegge
"demokratikus", es figyelmen kivul hagyja azt, hogy vannak
jobok melyek par-orasak de olyanok is, hogy hetek kellenek (mindket
esetben azonos szamu cpu hasznalataval)
Ez persze nem baj, sot ezt a kiindulopont, vagyis mindket queue-t, a
serial.q es parallel.q-t fel kellene osztani rovid es hosszabb
futasi idot engedelyezo egysegekre (pl sparallel.q es lparralel.q a
short es long-bol), peldaul  2/3 - 1/3 aranyban, vagy ami szukseges a
felhasznaloknak.
Ezeket az aranyokat a rendszergazdak az eddigi logokbol barmikor meg
tudjak mondani de ha megsem akkor mindig lehet parasztosan < 24h
es > 24h osztani, es majd finomhangolni a node-ok szamat is.

Ha ezt a felhasznalok tobbsege is esszerunek talalja akkor megerne egy
probat peldaul a kovetkezo karbantartas ideje alatt el is lehet(ne) vegezni.

udv
e






On 1/28/2014 8:57 AM, jeszenoi at caesar.elte.hu wrote:
> Kedves Mindenki!
>
> Mi az oka hogy a budapesti gépen már egy jó ideje nem indul el egyetlen 
> futásom sem (és ahogyan nézem másoknak is)? 30 üres node van jelenleg. A 
> még régebben (hónap elején) indított jobjaim lefutottak rendben, de 
> újabbakat csak a szegedi, vagy a debreceni gépre tudok elküldeni. Az 
> sbalance szerint a limitem 0 óra, gondolom emiatt nem indul el semmim, de 
> a többi gépen akkor miért sikerül minden? Nem igazán világos nekem a 
> dolog.
>
> üdv:


_______________________________________________
Hpc-forum mailing list
Hpc-forum at listserv.niif.hu
https://listserv.niif.hu/mailman/listinfo/hpc-forum 




További információk a(z) Hpc-forum levelezőlistáról