Cloudera數據科學平台加速企業數據科學及機器學習能力

【台北訊,2017年5月5日】以最新開放原始碼技術為基礎的全球領先機器學習和先進分析平台供應商Cloudera(NYSE:CLDR),發布其最新Cloudera 數據科學平台(Data Science Workbench)的正式版,這是一款針對Cloudera企業版的數據科學所做的全新自助服務工具。此數據科學平台為企業提供快速、簡易,且安全的自助式數據科學支援,並已於2017年聖荷西Strata+Hadoop World高峰會發表測試版。

Cloudera產品資深副總裁Charles Zedlewski表示:「我們正邁入機器學習的黃金時代,而這一切皆環繞於數據。然而,如何以最快的速度建立和測試新的分析專案依舊是數據科學家的一大課題,特別是在大規模的數據環境中。Cloudera數據科學平台是一款自助式服務工具,其強大的技術得以幫助企業加速建構、拓展,和部署機器學習解決方案的過程,讓數據科學家可以以最合適的方式自由地共用、協同和管理數據,進而讓生產過程更加簡單且快捷。」

藉由支援在網路瀏覽器中直接使用Python、R語言和Scala,Cloudera提供得以自助式數據科學體驗,同時也讓使用者可以在客製化的專案環境中下載和試用最新的資源庫和框架。Cloudera數據科學平台兼顧安全性和相容性,可支援Hadoop認證、授權、加密,和管理。

英國最大的獨立官方統計資料單位英國國家統計局(Office of National Statistics)希望藉由Cloudera數據科學平台進行可重複、精準,且可轉換的統計研究。英國國家統計局技術長Simon Sandford-Taylor表示:「透過Cloudera數據科學平台,我們縮短了模組的開發時間,也更容易掌握進度和結果。我們認為Cloudera數據科學平台具有極大的潛力幫助我們可以更快地發佈統計結果以及更好的成果分享。」

Cloudera數據科學平台整合了多種深度學習框架,包括BigDL,這是一款由Intel主導的開放原始碼的分散式深度學習資料庫,可用於Apache Spark。BigDL以分散式Spark / Hadoop為基礎架構,並可在Intel® Xeon®處理器(藉由Intel®數學核心程式庫;Intel® MKL)上以最佳化的效能運作,讓用戶可直接在Cloudera數據科學平台上應用BigDL。

Intel副總裁暨軟體與服務事業群系統技術及最佳化部門總經理Michael Greene表示:「企業客戶需要一個整合式平台來拓展其分析解決方案並最大化投資效益,BigDL和Apache Spark的原生整合為深度學習領域導入Apache Spark系統生態,並替企業客戶帶來了更高的價值。BigDL能夠幫助企業客戶更有效地運用現有的投資,並以效能最佳化的Intel®架構來建立其分析能力」

Cloudera數據科學平台與BigDL的整合帶來了許多好處,例如無需增加硬體設備或另外獨立出一個系統環境,就可以直接在CPU架構上運用深度學習資料庫及其能力,讓在本機建立Spark數據科學相關規劃變得更加便利,並可與Cloudera數據科學平台上的深度學習資料庫(BigDL)和其他Spark/Hadoop元件一併整合。