<html>
  <head>
    <meta content="text/html; charset=iso-8859-2"
      http-equiv="Content-Type">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    Kedves Mindenki!<br>
    <br>
    Xeon Phi-t próbáltam használni, tesztelni a budapest2 gépen.
    (VASP-ot fordítani)<br>
    <br>
    Az alábbi dolgokat probáltam ki, a VASP forrás FORTRAN
    alkalmazásával:<br>
    <br>
    - intel <a
href="https://software.intel.com/sites/default/files/11MIC42_How_to_Use_MKL_Automatic_Offload_0.pdf">MKL
      automatic offload</a>: (AO)<br>
    Elméletben minden ami intel MKL-vel van befordítva, az MKL
    automatikusan elküldheti a Phi-re.<br>
    <br>
    /opt/intel/composer_xe_2015/Samples/en_US/C++/mic_samples/LEO_tutorial
    -on található tesztprogram működik, de a VASP fordításom nem működik
    vele, vagy rosszul fordítottam, vagy nincs a VASP-ban (AO)-val
    gyorsítató rész.<br>
    <br>
    Mindenesetre gyanús, hogy OMP szálakkal sem igazi a skálázódás
    MKL_NUM_THREADS=10 az intel MKL-nek, így gondolom a phi-re nem is
    érdekes autómatikusan "párhuzamosítani", több lenne a kommunikáció
    mint a haszon.<br>
    <br>
    - intel compiler assisted offload:<br>
    Itt már bizonyos részek a xeon phi arhitekturájára (mic)
    lefordításáról lenne szó, de még mindíg a fő CPU-n levő szálak
    telhelésmentesítéséről lenne szó. Itt ha jól gondolom #pragma-al át
    kéne írnom az egész forrást, amire értelemszerűen nem vállalkoznék.<br>
    <br>
    #Ami szerintem kellene:<br>
    - VASP alapvetően jól skálázódik MPI szálakkal. Gond lehet esetleg a
    xeon PHI-kben levő szál/memória arány 16Gb/60=0.25Gb. Ez javítható
    OMP szálakkal, pl MKL_NUM_THREADS=4 vagy még több.<br>
    - Ebben az esetben natívan futna a PHI gyorsítón, mint egy valódi
    node. Ellenben meg kellene oldani hogy az intel MPI tudjon szálakat
    indítani a xeon phi-n, pl:<br>
    mpiexec.hydra -machinefile hosts.mic -perhost 1 $BINARY.mic<br>
    - Ekkor párhuzamosan futnának MPI threadok: pl 20db a 2 cpu-n, és a
    PHI-n is 2x15 db. skálázódástól függően, 2 külön fordított bináris
    külön külön. PHI-re be tudtam fordítani de kipróbálni sajnos nem:<br>
    - Ellenben ekkor meg kéne oldani, pl hogy ssh-val be lehessen lépni
    a phi-be. Gondolom erre a legegyszerűbb mód ha a teljes fáljrendszer
    fel lenne mountolva a PHI-kre is. De ezt én user jogon nem tudom
    megoldani, a gyorsítókártyákon jelenleg sima password van amikor
    megpróbáltam az egyikbe belelépni és natívan kipróbálni a fordított
    kódomat.<br>
    <br>
    Ehhez itt van leírás mit kéne tenni hogy fussanak az MPI feladatok a
    phi-ken is.<br>
<a class="moz-txt-link-freetext" href="https://software.intel.com/en-us/articles/using-the-intel-mpi-library-on-intel-xeon-phi-coprocessor-systems">https://software.intel.com/en-us/articles/using-the-intel-mpi-library-on-intel-xeon-phi-coprocessor-systems</a><br>
    <br>
    Előre is köszönettel,<br>
    Thiering Gergő<br>
    <br>
  </body>
</html>