[Hpc-forum] debreceni hpc

Miklos Emri emri at pet.dote.hu
2012. Sze. 11., K, 15:49:23 CEST


Szia Gábor!

Köszi az információt: a serial/parallel sorokról ezt nem tudtuk 
(gondolom elkerülte a figyelmünket valamelyik doksiban).

A döntésetek, hogy a párhuzamos jobokat részesítitek előnyben érthető, 
ha a job-ok nagy része nem adatpárhuzamosságon alapul. Ha azonban a 
jobok jelentős része ilyen, akkor teljesen mindegy, hogy az sge vagy egy 
belső kód darabolja az adatokat.
Az esetemben  nem gond az átírás, mert saját programról van szó, de aki 
más szoftverét használja (pl. gate, fsl) az nem tudja ezt megoldani és 
marad a több napos várakozás.

Arra nem gondoltatok, hogy az erőforrásokat dinamikusan osszátok meg? 
P.l. 15 percenként a szabad gépeket ahhoz a sorhoz rendelitek ami a 
terheltebb?
Esetleg nincs megoldás (sge konfig) arra. hogy a hosszan futó job-okat 
egy időre leültetitek, hogy  a rövidebb futásidejű job-ok is kapjanak 
processzort (ezzel a nagy számolásigényű jobok futási ideje kisebb 
arányban nőne ugyan, de a rövid számolást igénylő job-ok megkapnák azt a 
számolsái kapocitást amit igényelnek).

Elnézést a  "kötekedésért", de lassan ott tartunk, hogy fejben hamarabb 
megoldom a problémát mint ahogy job-jaim futásra kerülnek.

Üdv
Miklós


On 09/10/2012 08:51 AM, Rőczei Gábor wrote:
> Szia Miklós,
>
> A jobjaid serial jobok, melyek nem használják ki a több CPU-s környezetet. Ebből kifolyólag a serial.q-ban fognak "elindulni". Debrecenben jelenleg 432 ilyen jobot lehet elindítani összesen.
>
> Így áll most a várakozó sor (a serial.q esetén nincs szabad hely):
>
> roczei at service0:~> qstat -g c
> CLUSTER QUEUE                   CQLOAD   USED    RES  AVAIL  TOTAL aoACDS  cdsuE
> --------------------------------------------------------------------------------
> parallel.q                        0.47    492      0    599   1092     12      0
> serial.q                          0.98    432      0      0    432      0      0
> test.q                            0.09      0      0     12     12      0      0
> roczei at service0:~>
>
> Előbb-utóbb el fog indulni. Várnod kell türelmesen.
>
> Gábor
>
> Ui.: Csak megjegyzésként jegyzem meg, hogy az ilyen serial jobokat nem szuperszámítógépen kellene futtatni, hanem grides környezetben. Magyarországon a Hungrid pont ezt a célt szolgálja. Bővebb információ: http://www.lcg.kfki.hu/ A szuperszámítógépeken mi elsősorban a párhuzamos jobokat preferáljuk és azok számára biztosítunk több CPU erőforrást.
>
> On 2012.09.10., at 7:32, Miklos Emri wrote:
>
>> Sziasztok!
>>
>> Normálisnak tekinthető, hogy egy hpc-n (pl. a debreceni) egy job 14 óra után is wait állapotban van?
>>
>> Üdv
>> Miklós
>>
>> _______________________________________________
>> Hpc-forum mailing list
>> Hpc-forum at listserv.niif.hu
>> https://listserv.niif.hu/mailman/listinfo/hpc-forum




További információk a(z) Hpc-forum levelezőlistáról