在使用CNN演算法的雲端資料中心, Altera FPGA實現的加速功能具有優異的每瓦性能
2015年3月2日,台灣——Altera公司(NASDAQ:ALTR)今天宣佈,微軟(NASDAQ:MSFT)採用Altera Arria® 10 FPGA(現場可程式化閘陣列)實現採用CNN(卷積神經網路)演算法的資料中心加速功能,其每瓦性能非常優異。這些演算法通常用於影像分類、影像識別,以及自然語言處理等。
微軟研究人員在雲端技術上不斷取得進展,採用Arria 10開發套件和Arria 10 FPGA工程樣品,展示了每瓦40 GFLOPS的性能——資料中心業界最好的性能水準。而且,與GPGPU相比,在CNN平臺上,這一個FPGA的性能功率消耗比是CNN的3倍。之所以能夠達到這一個性能水準,是由於採用了開放軟體發展語言OpenCL與VHDL,對Arria 10 FPGA及其IEEE754硬式核心浮點DSP(數位訊號處理)模組進行程式設計。
微軟研究院客戶和雲端應用總監Doug Burger評論表示:「我們發現採用了Arria 10工程樣品之後,CNN性能和功率效益大幅度提升,矽晶片中DSP模組的高精度硬式核心浮點功能是我們取得令人注目的研究成果的主要原因。」在微軟的一篇部落格文章中,http://bit.ly/1MMMzvG,Burger介紹了資料中心在基礎設施上所遇到的難題,以及微軟是如何透過採用可程式化FPGA替代傳統CPU來解決這些難題。
Altera運算和儲存業務部總監Michael Strickland表示:「FPGA在神經演算法上有架構方面的優勢,能夠非常高效率的進行卷積和彙集,其靈活的資料通路支援大量的OpenCL核心直接互相傳送資料,而不需要使用外部記憶體。Arria 10在架構上還有更多的優勢,乘法和加法都支援硬式核心浮點——這種硬式核心浮點功能在邏輯數量和時鐘速度上要優於傳統的FPGA產品。」
Altera曾宣佈微軟使用其Stratix V FPGA在創新的Catapult電路板上加速進行搜尋,這類電路板於去年年底部署在第一個Bing資料中心的伺服器中。
相關評論
具有硬式核心浮點DSP功能的Altera 20 nm FPGA展示了業界最好的性能和功率效益水準
很多公司使用具有內置硬式核心浮點DSP功能的Altera Arria® 10 FPGA產品,獲得了令人矚目的每瓦性能。Altera與客戶和合作夥伴在解決方案上密切合作,實現高性能運算(HPC)、資料中心加速,以及金融系統。
微軟——微軟客戶和雲端應用總監Doug Burger
微軟研究院客戶和雲端應用總監Doug Burger評論表示:「我們發現採用了Arria 10工程樣品之後,CNN性能和功率效益大幅度提升,矽晶片中DSP模組的高精度硬式核心浮點功能是我們取得令人注目的研究成果的主要原因。」微軟的一篇部落格文章,http://bit.ly/1MMMzvG
Bittware——Bittware總裁兼執行長Jeff Milrod
Bittware總裁兼執行長Jeff Milrod評論表示:「Altera的Arria 10真正的改變了遊戲規則。利用這些元件中內建的浮點引擎,系統設計人員能夠非常方便、高效率的使用FPGA中大量的浮點資源。傳統的訊號處理應用現在可以直接連接Arria 10的類比訊號,以浮點方式處理它們。對於HPC和加速應用,再也不需要將FPGA演算法導出至定點,也不用對浮點進行低效率的定點模擬來實現。Arria 10內建的浮點功能性能高達40 GFLOPS/W,而且Fmax更高,只使用了三分之一的邏輯資源。與以前任何其他的解決方案相比,它使用方便,功率消耗低,速度快,佔用的資源更少。」
Gidel——Gidel創辦人兼技術長Reuven Weintraub
Gidel創辦人兼技術長Reuven Weintraub評論表示:「我們對於Altera Arria 10前所未有的單位功率消耗的觸發性能非常感興趣。長期以來,FPGA在位元、位元組和整數處理方面的單位功率消耗性能非常優秀。Altera Arria 10強大的單位功率消耗浮點性能為Gidel產品開闢了新天地,非常適合很多HPC和DSP應用。」
Nallatech——Nallatech 總裁、創辦人 Allan Cantle
Nallatech總裁、創辦人Allan Cantle評論表示:「Nallatech移植了我們客戶的產品程式碼,這需要使用Altera OpenCL編譯器的浮點數學功能。把這些功能在具有專用浮點DSP的新Arria 10 FPGA中實現,我們減少了對邏輯資源的佔用,而且提高了時鐘頻率,進一步提高了每瓦性能指標,使得Nallatech新的採用Arria 10架構的加速器在更多的應用領域中脫穎而出。」
ReFLEX CES——ReFLEX CES 首席工程師 Yann Casteignau
ReFLEX CES首席工程師Yann Casteignau評論表示:「ReFLEX CES最近發佈了採用Altera Arria10 FPGA的FPGA電路板,這主要受益於這一個第10代FPGA系列中新的浮點DSP模組。我們的目標是幫助客戶大幅度提高GFLOPS/W比(預期有三倍),同時,減少實現複數浮點運算所需要的邏輯資源,為客戶實現自己的設計留有更大的空間。我們很多客戶在高性能運算中都使用了ReFLEX CES電路板,功率消耗是他們面臨的主要難題。採用Arria10 FPGA之後,不但降低了功率消耗,而且運算性能更好。對於ReFLEX CES電路板,Arria10新的硬式核心DSP浮點運算是決定性的優勢,提高了性能,減少了所使用的邏輯資源,最佳化了GFLOPS/W比。」
Altera簡介
Altera®的可程式設計解決方案幫助電子系統設計人員快速、高效率地實現創新,突出產品優勢,贏得市場競爭。Altera提供FPGA、SoC、CPLD,以及電源管理等互補技術,為全世界的客戶提供高價值解決方案。請瀏覽http://www.altera.com。