IBM:美國IBM助力超越中國神威 重返全球超算“霸主” 專為AI而生

近年來中國 AI 風潮的興起,以及包含寒武紀、神威架構等多種計算核心的發展帶動之下,成功推動領先全球的超算架構發展,同時也代表算力核心的部分也逐漸擺脫美國供貨商的限制,走向自有化。

而寒武紀在 5 月發佈的 MLU100 及 MLU200 更可說是完全針對雲端 AI 計算的需求而推出,二者都基於 TSMC 16nm 工藝打造,以 PCIE 板卡形式呈現,這是寒武紀推出的雲端市場的專用產品。

IBM:美國IBM助力超越中國神威 重返全球超算“霸主” 專為AI而生

這兩顆芯片都同時支持推理和訓練,其中 MLU100 偏重推理,將面向數據中心和中小型服務器,而 MLU200 偏重訓練,將面向企業級人工智能研發中心。而隨著這兩個全新架構的推出,寒武紀也宣示通過其與中科曙光的合作,正式在國家級超算計算中推動真正自有的 AI 計算核心,而不是像過去必須依靠外來架構。

美國在相關技術發展的壓力之下,雖然也同步推動更先進超算中心的建立,每年花費大筆預算在發展超算相關技術,但總是被中國和日本等國家領先一步。

IBM:美國IBM助力超越中國神威 重返全球超算“霸主” 專為AI而生

圖丨IBM Power 9處理器

Summit 中採用的 IBM Power 9 架構,可以說是完全針對 NVIDIA 的 GPU 架構優化而來,其採用的 NVLINK 2.0 規格可帶來高達 300GB/s 的帶寬表現,很大程度上解決了數據傳輸過程的瓶頸,且因為 NVLIN 支持了緩存一致性設計,也同時能夠有效提升 GPU 的計算性能。

然而 Power 架構的優勢還不止於此,根據官方資料,IBM Power 9 的最大 I/O 帶寬是 Intel x86 處理器的 9.5 倍,可支持內存容量是 2.6 倍,高效能核心數量為 x86 的 2 倍,內存帶寬則是 x86 的 1.8 倍。更重要的是,通過 NVLINK 2.0,CPU 與 GPU 之間的互連帶寬達到 X86 服務器目前使用的 PCIe 3.0 的 9 倍,大大舒緩了 GPU 等待數據傳輸所造成的計算能力浪費。

Power 9 也不是指針對了 NVIDIA 的計算架構作優化,事實上,它針對的是所有平臺,包括 AMD、Xilinx,以及其他 AI 計算方案:IBM 與 AMD、ARM、華為等公司合作組件 CCIX 聯盟,推出集成了 CCIX 技術,為 Power 9 提供帶寬更高的總線加速器,就架構定義上來看,可以當作開放規格的 NVLINK,其最高帶寬表現也相近,IBM 也為此總線技術取名為 BlueLINK,以作為和 NVLINK 的區分。

IBM:美國IBM助力超越中國神威 重返全球超算“霸主” 專為AI而生

另外,IBM 也針對 Power 9 環境推出了分佈式深度學習軟件 (Distributed Deep Learning;DDL),可以讓處理器的 100% 擴容得到 95% 的效率增長,相較起一般公司,比如說 Facebook 的 89% 擴容效率明顯高出不少。

IBM Power 計算架構向世界展示了它的強大,而相較英特爾為主的 X86 體系逐漸走向封閉,其在支持 NVLINK 之類的獨家規格的同時,也和其他計算架構供貨商合作推出了基於 CCIX 界面的 BlueLINK 開放架構,其欲取代 X86 成為 AI 計算領域通用平臺的的意圖非常明顯。

另一方面,雖然面對寒武紀等專用 AI 計算芯片在超算領域的挑戰,NVIDIA 也藉此宣示 GPU 計算仍有其優勢存在。

Summit 不僅代表美國重奪超算話語權的決心,也成功讓 IBM Power 架構取代英特爾的 Xeon,重回超算領頭地位,同時通過 IBM Power 9 的架構優勢,讓 GPU 計算的性能表現得以再往上提升。

不過美國雖然借 Summit 重回超算榜首地位,但這個寶座恐怕坐不了多久,畢竟在 Summit 推出的同時,中國和日本等國家的超算計劃也都分別往前推進了不少,下半年恐怕就會被取而代之。

雖然Summit把算力推向另一個高峰,但接下來的幾年才是超算領域真正的重頭戲,全球的科技強國都會開始向號稱“超級計算機界的下一頂皇冠”的 E 級超算全力進攻。E級超算是指每秒可進行百億億次數學運算的超級計算機,它在解決能源危機、汙染和氣候變化等人類共同面臨的重大問題上將發揮超越以往的巨大作用。

就目前的發展情況來看,2020年或許將會成為這一重大突破實現的關鍵節點。例如在中國,就有中科曙光、國防科技大學以及江南計算技術研究所齊頭並進,同時獲批牽頭E級超算的原型系統研製項目。今年 5 月 17 日在天津舉辦的第二屆世界智能大會上,國家超算天津中心就對外首次展示了可以達到“E級超算”水平的“天河三號”的原型機。

而在其他國家,E 級超算也都有相應進展,美國阿貢國家實驗室計劃在 2021 年完成美國首臺 E 級超級計算機 A21 的建設,Intel 和 Cray 公司也會參與到 A21 的研製之中。而日本的E級超算可能會在 2021 或 2022 年發佈,歐盟也計劃在2021 年實現 E 級計算的突破。


分享到:


相關文章: