[Hpc-forum] [Szuper-hirek] h_vmem használt / Usage of h_vmem

Ferenc Bartha barthaf at sol.cc.u-szeged.hu
2012. Okt. 8., H, 11:18:26 CEST




 Kedves Gábor!

 Gyakran nem lehet megbecsülni sem, hogy mekkora memóriát igényel a 
számolás.

 Segíthet, ha a tipikus job-okra, futóknál és már lefutottaknál egyaránt, a
 felhasználók megnézik, hogy mekkora volt a maximális memóriaigény. Futó
 job-nál: qstat -j JOB_ID, lefutottnál: qacct -j JOB_ID. Mindkettőben a
 maxvmem értékét kell megnézni.
 (JOB_ID: az a szám, ami a pl. qstat válaszában az első oszlopban szerepel.)

 ÜdvFeri
 ------------:
 Dr. Ferenc BARTHA, tel: 62/54-6821, E-mail: barthaf at sol.cc.u-szeged.hu
 SKYPE: ferenc.bartha, WWW: http://www.staff.u-szeged.hu/~barthaf/
 SZTE DNT - High Performance Computing Group, 6725 Szeged, Szikra u. 2.
 SZTE, Department of Medical Chemistry, 6720 Szeged, Dóm tér 8.

> ----- Original Message ----- 
> From: "Rőczei Gábor" <roczei at niif.hu>
> To: <szuper-hirek at listserv.niif.hu>
> Sent: Monday, October 08, 2012 8:36 AM
> Subject: [Szuper-hirek] h_vmem használt / Usage of h_vmem
>
>
> Kedves Felhasználóink,
>
> Már több felhasználónknak gondot okozott a h_vmem használata ezért pár 
> sorban szeretném Önöknek összefoglalni, hogy mire érdemes odafigyelni.
>
> h_vmem-nek az a célja hogy a job csak akkor induljon el, ha elegendő 
> szabad memória áll rendelkezésre. Tulajdonképpen particionáljuk a 
> felhasználható fizikai memóriát és szétosztjuk a jobok között.
>
> Így kell használni:
>
> -l h_vmem=1G
>
> A job csak akkor fog elindulni, ha 1 GByte szabad memória lesz valamelyik 
> gépen. Párhuzamos jobok esetén ennek az értéke megszorzódik a kért slotok 
> számával.
>
> Fontos: ha például a párhuzamos jobunk esetén 10 slotot kértünk és 
> slotonkét 1 GByte memóriára van szükség akkor h_vmem=1G -t kell megadni, 
> nem pedig h_vmem=10G-t!
>
> Budapesten és Szegeden a default h_vmem érték 2.5GByte, ami akkor lesz 
> beállítva ha nem adott meg h_vmem értéket a job beküldésekor. Ha azt 
> szeretnénk, hogy a jobunk hamarabb induljon el és kevesebb memória is 
> elegendő a számára akkor egy kisebb h_vmem értéket érdemes beállítani.
>
> Pécsen és Debrecenben nincsen beállítva default h_vmem érték, mert az SGI 
> MPI (MPT)-s alkalmazások "meghalnak" emiatt. Pécsen és Debrecenben nem 
> ajánlott h_vmem-et használni SGI MPI esetén. Itt olvashatnak erről a SGI 
> MPI-os vmem hibáról: 
> http://techpubs.sgi.com/library/tpl/cgi-bin/getdoc.cgi/linux/bks/SGI_Developer/books/LX_AppTune/sgi_html/ch09.html#Z1078440651tls
>
> Az Open Grid Scheduler esetén van egy kezdeményezés ami nagyon ígéretes, 
> itt olvashatnak erről: 
> http://blogs.scalablelogic.com/2012/05/grid-engine-cgroups-integration.html A 
> cgroups használatával már elvileg megfelelő módon lehet majd a memóriával 
> kapcsolatos művelteket szabályozni, de erre még várni kell pár hónapot.
>
>                                                             --o--
>
> Dear Users,
>
> Several users have already experienced problems with the h_vmem option 
> therefore I would like to summary that what you need to pay attention.
>
> The target with h_vmem is that the job will start only if there are enough 
> free memory. We are partitioning the available physical memory and we are 
> distributing it among the jobs.
>
> Usage:
>
> -l h_vmem=1G
>
> The job will start only if there will be 1 GByte memory on one machine. 
> This value will be multiplied when you are using it by parallel job.
>
> Important: if you request 10 slots by parallel job and you reguest 1 GByte 
> memory per slot then you need request h_vmem=1G and not h_vmem=10G!
>
> The default h_vmem value is 2.5G in Szeged and Budapest which will be set 
> if you have not requested h_vmem by the job submission. If you would like 
> that your job start earlier and your job need less memory then you need to 
> set a lower value for h_vmem.
>
> We have not set the default h_vmem value in Pécs and Debrecen because the 
> SGI MPI (MPT) jobs will "die" in this case. We are not recommending that 
> you try to use h_vmem in Pécs and Debrecen. You can read here about this 
> SGI MPI's  vmem error: 
> http://techpubs.sgi.com/library/tpl/cgi-bin/getdoc.cgi/linux/bks/SGI_Developer/books/LX_AppTune/sgi_html/ch09.html#Z1078440651tls
>
> There is a promising initiative by Open Grid Scheduler which will be a 
> good solution. Here you can read about it: 
> http://blogs.scalablelogic.com/2012/05/grid-engine-cgroups-integration.html 
> You can limit the memory usage in adequately way with cgroups but we  have 
> to wait a few months for this.
>
> Best regards,
>
>               Gabor Roczei
> _______________________________________________
> https://listserv.niif.hu/mailman/listinfo/szuper-hirek
> http://www.niif.hu/szuper/ 




További információk a(z) Hpc-forum levelezőlistáról