<html><head></head><body><div style="color:#000; background-color:#fff; font-family:HelveticaNeue, Helvetica Neue, Helvetica, Arial, Lucida Grande, Sans-Serif;font-size:16px"><div id="yui_3_16_0_1_1456849445466_17606"><span id="yui_3_16_0_1_1456849445466_17641">Kedves Ferenc,</span></div><div id="yui_3_16_0_1_1456849445466_17606"><span><br></span></div><div id="yui_3_16_0_1_1456849445466_17606"><span id="yui_3_16_0_1_1456849445466_17642">Nem tudom, lehetséges, attól függ mennyire up-to-date az orphan -os lista. a cn004 node, például most nem szerepel ott, viszont nekem tegnap ami oda bekerült az ki is jött. a tegnapi kb 6 futásból 2 maradt meg mára, az egyik az előbb állt le a cn026 -on. Ez pl egy zsír új dinamika volt a slurm.out-ban ez :</span></div><div id="yui_3_16_0_1_1456849445466_17606"><span></span></div><div id="yui_3_16_0_1_1456849445466_17606" class="">slurmstepd: *** JOB 57782 CANCELLED AT 2016-03-02T08:48:58 DUE TO NODE cn026 FAILURE ***</div><div id="yui_3_16_0_1_1456849445466_17606" class=""><br></div><div id="yui_3_16_0_1_1456849445466_17606" class="" dir="ltr">más joboknál is ugyanez szerepel a slurm output végén, ezekkel a node -okkal: a cn047, cn012, cn004, cn003 fordul elő gyakran. minden leállt ezeken a node-okon.</div><div id="yui_3_16_0_1_1456849445466_17606" class="" dir="ltr"><br></div><div id="yui_3_16_0_1_1456849445466_17606" class="" dir="ltr">Köszi,</div><div id="yui_3_16_0_1_1456849445466_17606" class="" dir="ltr">A.</div><div id="yui_3_16_0_1_1456849445466_17606" class="" dir="ltr"><br></div><div dir="ltr" id="yui_3_16_0_1_1456849445466_17745" class=""><br></div></div></body></html>