ARM推出Cortex-A75、Cortex-A55及Mali-G72三款處理器 加速端點到雲端的人工智慧體驗

全球IP矽智財授權領導廠商ARM今(29)在臺北國際電腦展(COMPUTEX TAIPEI 2017)全新處理器,包括基於ARM DynamIQ技術的兩款CPU-ARM Cortex-A75處理器、ARM Cortex-A55處理器,以及ARM Mali-G72繪圖處理器,進一步提升人工智慧體驗。

人工智慧(AI)已使人們日常生活更為便捷並造成轉變,幾乎每天都會讀到或看到能夠拯救生命的AI創新概念原型產品。然而,複製人腦的學習與決策功能有賴於開發演算法,而開發演算法通常必須用到雲端密集(cloud-intensive)的運算力。不過,若希望讓改變生活的人工智慧全面普及,並且透過即時判定及更完善的隱私防護以更貼近使用者,那麼以雲端為中心的方法就不是最佳的長期解決方案。此外,在近期即將公布的調查結果顯示,全球85%的消費者都對於人工智慧的安全性抱持疑慮,這項關鍵指標反映出必須在端點(edge)裝置納入更多處理效能以及儲存個人資料,才能讓各界對人工智慧的隱私安全有更高的信心。

ARM 副總裁暨運算產品事業部總經理Nandan Nayampally表示:「全球70%的人口採用ARM的技術,實現安全且無所不在的人工智慧是ARM基本設計指導原則。因此,ARM有責任重新規劃人工智慧與其他擬人運算(human-like compute)體驗。為此,ARM必須為網路端點與雲端挹注更具效率且安全的分散式智慧(distributed intelligence)。」

ARM於3月首度推出ARM DynamIQ 技術,針對從晶片到雲端的分散式智慧達成第一個里程碑。今日推出首波採用DynamIQ技術的產品ARM Cortex-A75與Cortex-A55處理器,則又是另一項重要里程碑。兩款處理器均包含:

  • 基於DynamIQ技術為人工智慧效能任務提供專屬指令集(dedicated instructions),協助ARM在未來3到5年實現人工智慧效能提高50倍之目標
  • 採用DynamIQ big.LITTLE技術,在單一運算叢集中提高多核系統的功能與彈性
  • ARM TrustZone技術為數十億裝置提供安全基礎,在裝置端強化SoC的安全性
  • 提升先進駕駛輔助系統(ADAS)與自動駕駛的安全功能

為進一步優化分散式智慧與裝置端機器學習之系統單晶片(SoC),ARM更推出出貨量全球第一GPU的最新旗艦版-Mali-G72,新款Mali-G72繪圖處理器採用Bifrost架構,專為新一代要求嚴苛的應用而設計,例如在裝置上執行機器學習,以及高擬真行動裝置遊戲(High Fidelity Mobile Gaming)與行動虛擬實境(VR)等應用。

Cortex-A75: 突破單執行緒效能

Cortex-A75不僅在單執行緒(single threaded)效能有大幅提升,且具備完全無損能耗效率之領先優勢。Cortex-A75除了效能大幅提高50%,還搭載更佳的多核處理功能,使ARM合作夥伴能支援各種高效能使用情境,其中包括筆電、網路以及伺服器,耗電量維持在智慧型手機等級的水準。針對Cortex-A75進一步的效能數據以及技術功能的深入探討,可參考附件Stefan Rosinger的文章

Cortex-A55: 高效率處理的業界新領導者

基於Cortex-A53的系統單晶片(SoC)於2013年問市,自此之後各家ARM合作夥伴的累積出貨量已突破15億,且出貨量持續快速成長,這為後繼產品建立了難以超越的高標準。然而,Cortex-A55並非只是一個Cortex-A53的後繼產品。Cortex-A55憑藉專屬的人工智慧指令,並能實現相較於現今搭載Cortex-A53裝置2.5倍的每毫秒效率 (performance-per-milliwatt),Cortex-A55將是全球應用範圍廣的高效能處理器。附件Govind Wathan的文章則針對Cortex-A55效能數據及技術細節有更多說明。

彈性big.LITTLE大小核效能配置將能滿足更多日常應用裝置之需求

當分散式智慧從網路端點涵蓋至雲端,必須將不同級別的運算需求納入考量。DynamIQ big.LITTLE提供更強大的多核靈活性,涵蓋更多層面的效能與使用者體驗,讓用戶首度能在單一運算叢集中自行設定big與 LITTLE(大核及小核)兩種類型的處理器。

彈性的DynamIQ big.LITTLE技術正是分散式智慧所採取之系統級開發模式的核心。結合彈性CPU叢集、GPU運算技術、專屬的加速器以及全新ARM Compute Library,彼此協力運行,能夠使功耗更低,並提升人工智慧效能。免費開源的ARM Compute Library匯集了一系列針對Cortex CPU與Mali GPU架構進行優化的低階軟體函數。這是ARM承諾持續在軟體上投資更多,期能在硬體上達到最高的效能並兼顧功耗的最新範例。無論是新推出或是既有的基於ARM核心SoC,ARM Compute Library都能夠提升人工智慧與機器學習效能達10至15倍之多。

Mali-G72: 優化下一代真實世界內容

ARM系統級開發模式能實現包括GPU在內的各種運算IP區塊創新。Mali-G72 GPU承襲了前一代Mali-G71的成功基礎,更於Bifrost架構中加入許多改良,並帶來40%的效能提升,使合作夥伴們能提升行動虛擬實境體驗,並將高逼真行動遊戲推升至更高的境界。透過優化算術能力 (arithmetic optimizations)以及增加快取,可顯著降低頻寬以提升機器學習效率17%。

憑藉著提高25%的能源效率、提升20%的效能密度,以及全新機器學習優化功能,ARM能夠在SoC中更有效率的達成分散式智慧。更深入的技術細節,可參考附件Freddi Jeffries Mali-G72的文章

分散式智慧從這裡開始

今日ARM發表下一代CPU與GPU IP引擎,可支援最先進的運算任務。下圖所示是端點設備中最優化的基於ARM技術之SoC範例。除了全方位的運算、多媒體、顯示器、安全防護、以及系統IP,經過統合設計與驗證,實現最高效能且最具效率的行動運算體驗。連同這個套件推出的還有新版行動系統指南(System Guidance for Mobile, SGM-775),內容包羅萬象,從SoC架構到詳細的晶片投產前分析(pre-silicon analysis)文件、模型和軟體,ARM合作夥伴皆可免費取得。同時,ARM也提供基於Cortex-A75的POP IP,不但能加速進入市場時程,並達成最佳化晶片實現以確保最高效能和最佳效率。

從端點到雲端、領先業界的軟體生態系統

在未來高效率且安全的分散式智慧世界中,軟體將扮演中樞核心角色。ARM和其領先業界的生態系統在提供破壞式軟體創新方面具有獨一無二的優勢,將掀起人一場工智慧革命浪潮。除了新款Cortex CPU與Mali GPU,ARM還推出完善的軟體開發環境。結合ARM的虛擬原型(virtual prototypes)與DS-5 Development Studio開發工具,讓ARM生態系統搶在硬體釋出之前,即能針對DynamIQ技術開發最佳化的軟體。

ARM將攜手合作夥伴,致力在未來5年內實現下一個1000億顆基於ARM晶片出貨量的目標,透過比以前更高的靈活性,引領ARM生態系統從實體運算世界轉型到自然運算,即是兼具隨時連線(always-on)、直觀與智慧的環境。此次產品發表將ARM推向「無所不在的運算(Total Computing)」之願景更近一步,更帶動智慧解決方案的轉型。