Ang Radeon Open Compute 'ROCm' Stack v3.1 ay Inilabas Sa RAS Para sa Vega 7nm, Suporta ng SLURM Para sa Mas mahusay na Pamamahala ng Mapagkukunan, Ngunit Nawawala pa rin si Navi

Hardware / Ang Radeon Open Compute 'ROCm' Stack v3.1 ay Inilabas Sa RAS Para sa Vega 7nm, Suporta ng SLURM Para sa Mas mahusay na Pamamahala ng Mapagkukunan, Ngunit Nawawala pa rin si Navi 2 minuto basahin

AMD Radeon



Ang Radeon Open Compute o 'ROCm' na bagong stack ay ngayon magagamit para ma-download. Ang Radeon Open Compute v3.1 ay nagdadala ng ilang mga tampok, ngunit kakaiba, ang suporta para sa AMD Navi pati na rin ang GFX10 ay nawawala pa rin.

Ang ROCm, ang pinaka-tinatanggap na unibersal na platform para sa pag-compute ng GPU na pinabilis, ay nasa bersyon 3.1 na. Ang pinakabagong pag-update sa modular platform na nagbibigay-daan sa mga vendor ng hardware na bumuo ng mga driver na sumusuporta sa balangkas ng ROCm ay may kasamang ilang mga inaasahang tampok tulad ng suporta ng RAS para sa suporta ng 7nm Vega at SLURM para sa mga AMD GPU. Gayunpaman, sa mga kadahilanang hindi pa nalalaman, ang ROCm ay wala pa ring kumpletong suporta para sa susunod na henerasyon na AMD Navi Architecture.



Ano ang Bago Sa Radeon ROCm v3.1:

Ang pinakamalaki at halatang pagbabago sa bagong pag-install ng Radeon ROCm v3.1 ay nasa istraktura ng Direktoryo ng Pag-install ng ROCm. Ang isang sariwang pag-install ng toolkit ng ROCm ay nag-i-install ng mga pakete sa / opt / rocm- folder. Dati, ang mga package ng toolkit ng ROCm ay na-install sa / opt / rocm folder.



Ang bagong bersyon ng ROCm ay pinahusay ang suporta sa pagiging maaasahan, Accessibility, at Serviceability (RAS) para sa mga Vega 7nm GPU. Ang gawaing 7nm Vega na ito ay maaaring sa ilalim ng mikroskopyo pa rin para sa Batay sa Vega na 'Arcturus' compute accelerator darating sa taong ito. Kasama sa suporta ang:



  • UMC RAS ​​- HBM ECC (hindi maitatama na injection injection), pagreretiro sa pahina, pagbawi ng RAS sa pamamagitan ng pag-reset ng GPU (BACO)
  • GFX RAS - GFX, MMHUB ECC (hindi wastong pag-iniksyon ng error), pag-recover ng RAS sa pamamagitan ng pag-reset ng GPU (BACO)
  • PCIE RAS - PCIE_BIF ECC (hindi wastong error na iniksyon), pagbawi ng RAS sa pamamagitan ng pag-reset ng GPU (BACO)

Ang Radeon ROCm v3.1 ay nakakakuha din ng Suporta ng SLURM para sa mga AMD GPU. Ang SLURM o Simpleng Utility ng Linux para sa Pamamahala ng Mapagkukunan ay isa sa pinakamamahal at madaling gamiting pamamahala ng cluster at pag-iiskedyul ng trabaho para sa mga kumpol ng Linux. Mas gusto ang SLURM dahil sa pagiging open-source, mapagparaya sa kasalanan, at lubos na masusukat.

Ang sistemang ito ay maaari nang makipag-ugnay nang maayos sa mga AMD GPU. Ang pinakabagong bersyon 20.02.0 ng SLURM ay may kasamang mga AMD plugin na nagbibigay-daan sa SLURM upang makita at awtomatikong i-configure ang mga AMD GPU. Kinokolekta at iniuulat din nito ang pagkonsumo ng enerhiya ng mga graphics chips. Ang suporta ng SLURM ay isang kapaki-pakinabang na karagdagan na binibigyan ng pagtaas ng bilang ng mga super-computing na pag-deploy gamit ang Radeon GPUs at iba pang mas malalaking mga kumpol ng AMD GPU.

Sa kabila ng pagsasama ng maraming mga tampok, wala pa ring mga palatandaan ng suporta ng GFX10 / Navi sa ROCm. Ang Pahina ng GitHub para sa ROCm ay na-update upang ipakita ang lahat ng mga pagbabago, tala ng pag-install, at mga kilalang isyu.



Mga tag amd