AMD推出新版ROCm 成為GPU運算功能最多元的開放原始碼平台

台北—2016年11月15日—AMD(NASDAQ:AMD)在SC16大會上,發表新版Radeon開放運算平台(ROCm),內含對全新Radeon GPU硬體的軟體支援、新數學函式庫和基礎豐富的現代程式語言,設計旨在加快開發高效能且高能源效率的異質運算系統。AMD同時宣布在即將發表的ROCm中將支援OpenCL™及眾多CPU,包括AMD即將推出的「Zen」核心CPU、Cavium ThunderX CPU,以及IBM Power 8 CPU。這些優勢進一步鞏固ROCm作為GPU運算功能最多元開源平台的地位。

AMD Radeon繪圖技術事業群全球資深副總裁暨首席架構師Raja Koduri表示,Radeon開放運算平台為運用GPU解決問題的新時代提供強大平台,旨在發揮開放軟體的力量,以針對高效能運算(HPC)與超大規模運算提供新的解決方案。全新發布的ROCm為開發者在GPU運算的應用範疇與使用模式帶來極大彈性。我們很高興在SC16大會展出這些卓越的應用程式。

Red Hat公司平台工程部副總裁Denise Dumas表示,異質運算開放模式不僅能將HPC的各種優勢直接帶給開發者,還為他們提供充裕的靈活性,善用手上的運算資源,並讓硬體發揮最佳效能。作為促進與維護開放原始碼社群的領導者,我們很高興看到AMD以社群主導的發展模式推動ROCm。

Cavium公司軟體產業體系與解決方案事業群副總裁Larry Wikelius表示,AMD GPU對ThunderX®的支援結合ROCm軟體的眾多功能,為Cavium旗下HPC與超大規模伺服器市場的整體解決方案增添價值。AMD進一步補強ThunderX®的創新功能,ThunderX為客戶以及目前正開發這些市場的夥伴廠商提供內含48個ARMv8核心、整合I/O,以及雙插槽組態的支援。

新版ROCm帶來眾多更新,其中包括:

  • 擴大GPU支援:ROCm現在能支援所有Polaris架構的繪圖產品,包括 Radeon™ RX 460、470、480顯示卡和Radeon™ Pro WX 7100、5100、4100 GPU,豐富了ROCm支援的產品組合。Polaris架構為低階編程特別設計,協助開發者發揮硬體的最大效益。
  • ROCm透過作業系統容器以及Linux®的核心虛擬機器(KVM)虛擬化GPU硬體:ROCm現支援Docker容器化,協助終端使用者簡化在支援ROCm的Linux伺服器環境中部署應用程式的流程。此外,ROCm還能透過KVM的穿透(pass-through)功能支援GPU硬體虛擬化,在虛擬化解決方案中發揮GPU硬體加速運算的優勢。
  • 異質運算編譯器(HCC):HCC是用於CPU與GPU的單源ISO C++ 11/14編譯器,支援C++17「平行標準樣板函式庫」(Parallel Standard Template Library)。它採用多元的編譯器基礎架構,包含LLVM基礎的GCN ISA程式碼產生技術,並支援組譯器與反組譯器。
  • 異質運算介面移植(HIP):HIP讓開發者運用HIPIFY將CUDA應用程式移植到ROCm環境,能自動轉譯至HIP核心語言與API執行架構,產生的移植程式能在幾乎任何運用NVIDIA CUDA編譯器或HCC的GPU上執行。
  • 新數學加速函式庫:ROCm納入對新型先進數學加速函式庫的支援,包括基礎線性代數程式集運算(BLAS)、快速傅立葉變換運算(FFT),以及N維空間張量收縮等。

除了發表ROCm,AMD還宣布正持續努力擴張ROCm產業體系,提供更多的伺服器CPU支援,未來還計畫支援OpenCL。未來釋出的新版ROCm預期將支援AMD「Zen」核心的x86 CPU、ARM AArch64 CPU架構的Cavium ThunderX處理器,以及IBM旗下的Power 8 CPU和伺服器,滿足客戶對超大規模與HPC持續成長的需求。OpenCL建構在ROCm執行架構與編譯器基礎上,透過direct-to-metal存取功能,更有效率的對GPU進行低階控制。

新版Radeon Open Compute已在此網站釋出https://github.com/RadeonOpenCompute/ROCm

SC16大會展出

AMD在SC16大會的1431號區展示:

  • ROCm技術叢集,在Supermicro®公司的伺服器上執行機器學習程式碼
  • 透過HIP移植工具,移植CUDA應用程式Caffe
  • 運用AMD FirePro™ S9300 X2與Radeon™ R9 Nano GPU執行光跡追蹤與VR視覺化運算
  • 鎖定各種GPU與平台的OpenMP 4.5互通能力
  • IBM Power8伺服器搭載AMD FirePro™ S9170伺服器GPU來運行ROCm
  • Penguin Computing公司搭載Tundra™ Extreme ARMv8 ThunderX架構的伺服器搭載Radeon™ RX 460,並運行ROCm
  • 在ROCm平台上運用無顯式設計(Headless)的OpenGL/EGL Interop OpenCL系統進行原位渲染

相關資源