[Hpc-forum] debreceni hpc
Miklos Emri
emri at pet.dote.hu
2012. Sze. 11., K, 15:49:23 CEST
Szia Gábor!
Köszi az információt: a serial/parallel sorokról ezt nem tudtuk
(gondolom elkerülte a figyelmünket valamelyik doksiban).
A döntésetek, hogy a párhuzamos jobokat részesítitek előnyben érthető,
ha a job-ok nagy része nem adatpárhuzamosságon alapul. Ha azonban a
jobok jelentős része ilyen, akkor teljesen mindegy, hogy az sge vagy egy
belső kód darabolja az adatokat.
Az esetemben nem gond az átírás, mert saját programról van szó, de aki
más szoftverét használja (pl. gate, fsl) az nem tudja ezt megoldani és
marad a több napos várakozás.
Arra nem gondoltatok, hogy az erőforrásokat dinamikusan osszátok meg?
P.l. 15 percenként a szabad gépeket ahhoz a sorhoz rendelitek ami a
terheltebb?
Esetleg nincs megoldás (sge konfig) arra. hogy a hosszan futó job-okat
egy időre leültetitek, hogy a rövidebb futásidejű job-ok is kapjanak
processzort (ezzel a nagy számolásigényű jobok futási ideje kisebb
arányban nőne ugyan, de a rövid számolást igénylő job-ok megkapnák azt a
számolsái kapocitást amit igényelnek).
Elnézést a "kötekedésért", de lassan ott tartunk, hogy fejben hamarabb
megoldom a problémát mint ahogy job-jaim futásra kerülnek.
Üdv
Miklós
On 09/10/2012 08:51 AM, Rőczei Gábor wrote:
> Szia Miklós,
>
> A jobjaid serial jobok, melyek nem használják ki a több CPU-s környezetet. Ebből kifolyólag a serial.q-ban fognak "elindulni". Debrecenben jelenleg 432 ilyen jobot lehet elindítani összesen.
>
> Így áll most a várakozó sor (a serial.q esetén nincs szabad hely):
>
> roczei at service0:~> qstat -g c
> CLUSTER QUEUE CQLOAD USED RES AVAIL TOTAL aoACDS cdsuE
> --------------------------------------------------------------------------------
> parallel.q 0.47 492 0 599 1092 12 0
> serial.q 0.98 432 0 0 432 0 0
> test.q 0.09 0 0 12 12 0 0
> roczei at service0:~>
>
> Előbb-utóbb el fog indulni. Várnod kell türelmesen.
>
> Gábor
>
> Ui.: Csak megjegyzésként jegyzem meg, hogy az ilyen serial jobokat nem szuperszámítógépen kellene futtatni, hanem grides környezetben. Magyarországon a Hungrid pont ezt a célt szolgálja. Bővebb információ: http://www.lcg.kfki.hu/ A szuperszámítógépeken mi elsősorban a párhuzamos jobokat preferáljuk és azok számára biztosítunk több CPU erőforrást.
>
> On 2012.09.10., at 7:32, Miklos Emri wrote:
>
>> Sziasztok!
>>
>> Normálisnak tekinthető, hogy egy hpc-n (pl. a debreceni) egy job 14 óra után is wait állapotban van?
>>
>> Üdv
>> Miklós
>>
>> _______________________________________________
>> Hpc-forum mailing list
>> Hpc-forum at listserv.niif.hu
>> https://listserv.niif.hu/mailman/listinfo/hpc-forum
További információk a(z) Hpc-forum levelezőlistáról