POWER架構的PGI Accelerator編譯器透過POWER8與NVIDIA NVLink 發揮極致GPU加速效能

NVIDIA (輝達) 今天宣布全面釋出 PGI Accelerator Fortran 、 C 與 C++ 語言程式編譯器套件,其中包括支援  OpenACC®  的平行運算程式,讓編譯後的程式能在搭載 POWER  CPU 的系統如 IBM OpenPOWER LC 伺服器上執行,其搭載支援 NVIDIA® NVLink™  互連技術的NVIDIA Tesla® GPU  加速器與 POWER8 CPU 效能結合。

最新釋出的程式讓 PGI 用戶在包括多核Linux/x86或Linux/POWER CPU、搭載或未搭載GPU加速器的平台都能輕易建置與維護大型 HPC 應用程式,並延用相同原始碼、編譯器選項、以及組譯指令腳本。這讓 HPC 開發者能更有效率地運用與發揮多重系統架構,透過最佳化編譯器的支援能力,在轉換各種系統的程式時,能夠維持效能轉移性,輕鬆切入 GPU 程式開發作業。

NVIDIA PGI 編譯器與工具部門總監 Douglas Miles 表示:「此次釋出象徵我們的工作達成一項里程碑,為 HPC 開發者提供適合途徑,將程式轉移到所有主流的 CPU 與加速器平台上,並能沿用相同原始碼同時維持一致的高效能。這樣的解決方案對現今越來越普及的異質平行運算平台而言非常重要,尤其在加速型 HPC 系統架構持續朝更複雜的記憶體結構演進時,如果編譯器沒有擔起記憶體階層的管理任務,其複雜的工作就得由程式開發人員自己解決。」

除了 Fortran 2003 、 C11 與 C++14  等程式語言的功能外,符合 OpenPOWER 規範的全新 PGI 編譯器還納入專為 PGI 所設計的 CPU 、加速器技術與各種優化功能,其中包括 OpenMP 3.1、OpenACC 2.5 以及 CUDA® Fortran。專為 POWER 的 PGI Accelerator 同時也收錄 PGPROF CPU 加 GPU 效能分析器,這項重要的元件能針對在加速器上運行的程式進行效能分析與優化。PGI Accelerator 編譯器與 POWER 專屬工具都已全部納入 PGI 旗下針對 Linux 系統所推出的產品中,其中也包括最新免費版 PGI Community Edition。

IBM 高效能運算與資料分析部門副總裁 Sumit Gupta 表示:「像 OpenMP 與OpenACC 這類更簡易的程式開發方法,對於 GPU 加速系統的普及非常重要。全新 PGI 編譯器發揮 NVIDIA NVLink 高速連結的優勢,串連 POWER8 CPU 以及 Pascal 架構的 Tesla P100 GPU 加速器,再加上分頁轉移引擎,用戶能更輕易地加速與提升高效能運算與資料分析作業的效能。」

OpenPOWER 專屬 PGI 編譯器的重點優勢:

  • 在單一 CPU 以及混用 CPU與GPU 的兩種架構上達到效能轉移性
  • 能在採用 x86 與 OpenPOWER 處理器的系統上執行相同的原始碼
  • 在 NVIDIA Tesla GPU 上支援 OpenACC 與 CUDA Fortran 程式
  • 支援搭載全新 POWER8 CPU 並內建 NVIDIA NVLink 與 NVIDIA Tesla P100 GPU的系統

橡樹嶺國家實驗室將運用支援 OpenPOWER 的 PGI 編譯器套件與其他工具建立與執行各種大型 HPC 程式,並在 x86 CPU 、 OpenPOWER CPU 以及 NVIDIA GPU 等硬體程式上運行相同的原始碼。

橡樹嶺國家實驗室科學運算小組召集人 Tjerk Straatsma 表示:「HPC 程式要從某個平台轉移到另一個平台是極為艱鉅的任務,尤其必須採用新的硬體技術時。這樣的架構與效能可轉移性對於我們的程式開發者與使用者尤為重要,我們能將能夠把現有如 Titan 這類主機上運行的單一 CPU 或 GPU 運算程式,轉移到 DOE 能源部未來採用的大型系統中,其中也包括我們在橡樹嶺國家實驗室安裝的 Summit 系統。」

欲了解 OpenPOWER 的 PGI Accelerator 編譯器相關訊息,請瀏覽:www.pgroup.com/openpower