首個爲AI而生的伺服器CPU誕生,GPU、FPGA、TPU如何回應?

首个为AI而生的服务器CPU诞生,GPU、FPGA、TPU如何回应?

摩爾定律難題,另一條解題路徑已經被業界認可……

首个为AI而生的服务器CPU诞生,GPU、FPGA、TPU如何回应?

12月問世的POWER9,恐怕是第一個喊出為AI而生的服務器CPU了。從通用CPU到AI定製CPU,到底反應了整個業界怎樣的趨勢?

如果說摩爾定律是芯片產業自循環的產物,那麼為應用而生的芯片則體現了IT產業的整體趨勢。

“芯片上的晶體管數量每18-24個月增加一倍。”1965年摩爾定律問世。今天,摩爾定律已經成為困擾半導體行業超過50年的難題:製程工藝不可能無限縮減,“更快更小”正遭遇能耗瓶頸。

進入14納米時代,更強的計算能力就必須更多更快的CPU嗎?這個疑問的初始假設是通用的計算能力,而在工作負載類型多樣化的時代,處理器發展趨勢的話題已經跳出了自身半導體行業的格局。

首个为AI而生的服务器CPU诞生,GPU、FPGA、TPU如何回应?

IBM全新POWER9處理器旨在為數據密集型人工智能工作負載管理自由流動數據、流傳感器及算法。該處理器採用14納米技術,嵌入80億個晶體管。

從整個服務器CPU芯片行業來看,有三種截然不同的風格——英特爾和AMD代表“x86”,高通和Cavium代表“ARM”,IBM代表“POWER”。儘管CPU性能仍然在增長,但進化速度相比前十年已經顯著減緩。加速協處理器即比通用CPU更加專注於特定工作負載的處理器得到追捧,尤其是AI這種計算密集型工作負載,不僅讓GPU、FPGA作為加速協處理器翻開了新的一頁,谷歌的TPU也因運而生。

從整個IT產業角度看,以具體工作負載為導向的異構計算大行其道,那麼CPU怎能無動於衷呢?

IBM POWER9這次直接了當表明身份——為AI定製,那麼英偉達的GPU、賽靈思的FPGA、谷歌的TPU又是如何回應的?

就處理器系統而言,POWER9試圖通過最新的技術和聯盟來解決系統短板——異構處理器是否有足夠的帶寬與系統的其它部分進行通信。

POWER9相比POWER8,採用PCI-E 4.0、新一代NVIDIA NVLink及OpenCAPI的系統,這幾項技術的結合使其能夠加速數據傳送,IBM內部測試表明,在計算速度方面超出基於PCI-E 3.0的x86系統9.5倍。這意味著什麼呢?

POWER處理器的CAPI(Coherent Accelerator Processor Interface)技術,讓I/O的加速器可以和CPU共享它的內存、緩存,這是IBM對業界開放的標準,用以互補業界標準PCI-E。在2016年10月IBM還成立了基於CAPI 2.0技術的OpenCAPI聯盟,這大大加速了CPU和GPU、FPGA甚至TPU之間的通信,因此也吸引了包括AMD、谷歌、賽靈思、Mellanox、Micron等企業加盟。尤其是POWER9可以支持最新的英偉達Nvida NVLINK技術,可大幅提升GPU與CPU之間的數據交換速度。

由此可見,對於首個針對AI設計的服務器CPU——POWER9,將加速POWER和GPU、FPGA、TPU之間的合作。

首个为AI而生的服务器CPU诞生,GPU、FPGA、TPU如何回应?

1

軟件定義芯片的趨勢

既然針對工作負載,AI的提速不僅與處理器相關,也與軟件息息相關。深度學習是一種機器學習方法,目前正在快速發展。通過數百萬次計算及大量的數據分析來提取和排序信息,可以甄別與排列數據最為重要的方面。為了滿足這些日益增長的行業需求,IBM於四年前開始著手設計POWER9芯片,構建一套全新架構,用於管理自由流動的數據、流傳感器,以及基於Linux操作系統的數據密集型人工智能和深度學習算法。而且,POWER9專門為提高Chainer、TensorFlow和Caffe等通用AI框架的性能而設計。

比如,今天很多AI開源框架只是跑在一臺服務器上,通過POWER9密度的增加,支持GPU個數從4個增加到6個,使得單機性能大幅度提升。

值得關注的是,IBM推出流行的開源機器學習框架TensorFlow的新分佈式計算版本。這個版本的TensorFlow將通過利用GPU增強服務器的虛擬化集群來顯著縮短深度學習訓練時間(從數週到數小時)。POWER9就可以支持這種橫向擴展能力,讓開源框架跑在多個服務器上,從而進一步提升AI效率。

2

谷歌和美國能源部在用POWER9

儘管IBM才宣佈POWER9上市不久,谷歌在去年就宣佈,正在開發基於Power9處理器的服務器體系結構,並且POWER架構在工具鏈中得到完全支持。

谷歌Platform副總裁Bart Sano表示,谷歌對於IBM在開發最新的POWER9技術方面取得的進展感到非常興奮。POWER9 OpenCAPI總線和大容量內存功能為谷歌數據中心的創新提供了更多機會。

實際上,業界已經在期待谷歌對POWER9的支持力度比POWER8更進一步:谷歌已經做了大量工作,將相關軟件移植到POWER8上,並構建了大量硬件設計,而IDC服務器和計算平臺研究經理Peter Rutten就透露,谷歌已經在其數據中心部署POWER9。

此外,POWER9的首批客戶還包括美國能源部,未來兩個季度IBM為美國能源部的Summit和Sierra超級計算機安裝超過一萬個節點,耗資3.25億美元。

值得一提的是這兩臺超級計算機的指標——橡樹嶺國家實驗室的Summit HPC系統預計將達到每秒200 petaflops的速度,勞倫斯利弗莫爾國家實驗室的Sierra超級計算機預計將達到每秒125 petaflops。就指標來看,也許將稱霸明年的超級計算機HPC TOP500的榜單。

科技茱比莉

有視角的科技觀察 有態度的科技評論


分享到:


相關文章: