三分天下有其二,美國E級超算為何偏愛AMD

日前,一條新聞引起了全球超算領域的關注:美國三大E級超算的最後一套,名為El Capitan的超級計算機正式宣佈採用AMD平臺。

三分天下有其二,美國E級超算為何偏愛AMD

El Capitan超算

來自官方的數據顯示,El Capitan超算預計將於2023年投入使用,算力將達2EP(200億億次每秒),是現有最快超算算力的10倍,並能夠實現4倍的能效進步。勞倫斯·利弗莫爾國家實驗室主任Bill Goldstein更是用“無與倫比的計算能力”來描述這套系統。

至此,美國能源部的E級超算競賽計劃(Exascale Computing Initiative)全部浮出水面,其規劃的Frontier、Aurora、El Capitan三大E級超算中,有兩套都基於AMD平臺實現,包括採用AMD提供的CPU和GPU等全套設備,這從側面印證了AMD在產品技術與市場營銷上的成功。

這裡我們有必要簡單介紹一下美國能源部。如果從字面意思來了解,能源部的主要職責就是統一管理各類能源的勘探、研究、開發和利用,但事實上因為能源勘探需要許多高新技術的支持,所以包括超算在內的許多技術都歸屬於能源部主導,我們也可以將其理解為美國的“發改委”。

三分天下有其二,美國E級超算為何偏愛AMD

而在多年的技術推動中,美國能源部共計建設了17家國家實驗室,以此為美國提供了戰略性的科技實力——比如這次El Capitan超級計算機所在的勞倫斯利佛摩爾國家實驗室,另外的兩大超算Frontier和Aurora則分別位於橡樹嶺國家實驗室和阿貢國家實驗室。

雖然有這麼多的實驗室,但其實在超算領域美國一直有非常深厚的積澱,在此之前也採用過包括英特爾、IBM等多種超算平臺。那麼,為什麼在最關鍵的、邁向百億億次計算的E級超算道路上,美國連續兩次選擇了AMD?為什麼包括IBM在內的其他老牌勁旅都沒能入選呢?

這還要從AMD的復興說起。自2017年推出EPYC(霄龍)系列產品開始,AMD就迎來了發展的春天,特別是在2019年8月宣佈的第二代EPYC處理器使得產業都見證了7nm工藝帶來的魅力,更創造了前所未有的64核心。對於追求性能的超級計算機來說,自然是求賢若渴。

超級計算,人類無止境的性能追求

乍聽起來,超算是一個距離普通人非常遙遠的概念,許多人甚至只是在歷史書中聽到過這個名字。但其實在我們日常的生活中,超算應用的案例數不勝數,比如大家每天關注的天氣預報就是得益於超級計算機的運算和推演,而包括現在我們聽到的大數據、人工智能等許多概念背後都離不開超級計算機的身影。

在當下的智能化時代,計算力就代表了生產力,而如何選擇計算力,也能夠直接反應到我們的生產和生活當中。一直以來,超級計算機應用就面臨著性能不足的情況,那些運行在超算上的上萬核甚至幾十幾百萬核心的超大規模應用如一個個“性能怪獸”,也敦促著開發者們提供更強大的計算性能。

這也就解釋了為什麼AMD能夠在超算應用中更受青睞。得益於7nm工藝,第二代AMD EPYC產品最高可以支持64個核心,這也就代表著在單位的空間密度內,AMD可以提供超過競爭對手一倍的核心數量,也帶來了成倍的性能提升。如此一來,那些怪獸級應用也就更能夠流暢的運行,並且在最短的時間內輸出結果。

三分天下有其二,美國E級超算為何偏愛AMD

JOLIOT-CURIEROME超級計算機

這就能解釋為什麼超算行業對AMD寄予厚望。距離8月發佈僅僅3個月之後,在2019年11月公佈的第54屆全球超算TOP500榜單中,來自於法國原子能委員會研究中心的超級計算機“JOLIOT-CURIEROME”就在排名中獲得了59名的好成績,這也是第一套上榜的第二代EPYC系列平臺,它採用了2262個計算節點,是法國性能最強大的超級計算機。

AMD EPYC+超算雲優化=性能翻倍

在中國,AMD也迎來了廣闊發展空間。2019年11月28日,北京超級雲計算中心國內首套基於第二代AMD EPYC平臺的大規模集群首期新資源暨科技雲超算雲隊列新技術發佈。據公開資料顯示,新系統採用了主頻為2.35GHz的第二代AMD EPYC處理器,節點數量超過1000臺,核心數量達到64000個,純CPU峰值性能可達2500萬億次每秒,是迄今為止國內最快的AMD平臺。

三分天下有其二,美國E級超算為何偏愛AMD

一直以來,關於AMD平臺的兼容性與適配性是大眾關注的問題。特別是在高性能計算的科研領域,雖然同為x86架構,但是在實際應用中依然需要進一步的優化和配置,以獲得最佳性能。這次,北京超級雲計算中心也為採用AMD平臺進行計算的用戶提供了免費的優化服務。

據負責人陳博士表示,之前有許多用戶的程序可能來自於不同的平臺,而用戶往往對於程序的優化缺乏瞭解,因此在使用初期成績並不理想。在瞭解到這些問題之後,北京超級雲計算中心免費為這些用戶提供了程序調優工作,針對AMD平臺特別是64核心進行了重新配置,最終使得用戶的實際應用成績大幅度提升,甚至出現了性能翻倍的情況。

這樣一來,原本那些需要一週甚至十多天才能實現的工作,現在只要三五天即可實現,在節省了計算資源的同時,也幫助用戶節省了費用。如今,北京超級雲計算中心的AMD平臺運轉良好,實測性能大大超乎客戶預期,每天的運行效率都接近於峰值。

對超算產業來說,美國和中國是兩個最大的經濟體,也是全球超算大國,除此之外,包括歐洲和日本等國家的超算能力也不可小覷。不過日前有越來越多的消息顯示,包括英國愛丁堡超算中心的Archer超級計算機和德國斯圖加特高性能計算中心Hawk超級計算機都將採用第二代AMD EPYC平臺進行搭建,這也意味著AMD平臺已經在全球市場遍地開花。

64核心,超算雲平臺的高效利器

如果說美國能源部選擇AMD是看中了多核心帶來的性能優勢的話,那麼包括中國和歐洲在內的超算中心選擇AMD又意味著什麼呢?這裡我們就必須明確一個概念——超算中心所提供的計算服務,大多也是通過雲平臺實現的。

這正是AMD的價值所在。我們知道,面對全球雲化的大潮,任何一家超算中心或者公司都不能獨善其身,作為管理者和運營者,每個人都看重雲化時代的性能價值,更看中無論是單個虛擬機還是單個容器的性價比。而當我們注意到這個問題的時候就會發現,AMD提供了一個非常不錯的選擇。

我們一再強調,第二代AMDEPYC處理器可以提供高達64個物理核心,而在雲化平臺中這也就意味著最多可以實現64個虛擬機或容器。換句話說,對於超算中心或者超算雲平臺來說,AMD已經提供了最大化的虛擬化能力,更重要的是這些虛擬化的服務器性能也是領先的。

業界著名的虛擬化公司VMware曾推出過一款名為VMmark的基準測試工具,用於模擬數據中心的常用操作,並以此評價虛擬化環境中多個負載的性能和擴展性。具體說來,VMmark使用tile(每tile包含8臺虛擬機)為基本單位,其整體測試得分由每個tile的虛擬化得分和虛擬化架構操作得分兩部分組成,分數越高,意味著虛擬機服務響應越好,VMware虛擬化性能就越高。

三分天下有其二,美國E級超算為何偏愛AMD

而根據SPEC測試平臺公佈的VMMARK 3VIRTUALIZATION測試項目結果,第二代AMD EPYC處理器平臺以12.78的成績獲得了第一名,超過競爭對手41.6%,這也就意味著如果進行超算雲應用的話,基於第二代AMD EPYC處理器所搭建的虛擬機能夠提供41.6%的性能優勢;再加上專業團隊的調優,最終就能實現我們上面提到的200%的性能提升。

這一點對於商業公司來說至關重要。花同樣的錢獲得更好的性能,恐怕沒人能夠拒絕AMD這樣的好意,無論在公有云、私有云還是超算雲平臺上都一樣。正因為如此,那些基於核時實現的雲服務方式都可以憑藉第二代AMD EPYC處理器獲得更大的提升,而且對於用戶本身來說這些強大的性能也有助於計算時間的大大縮減,可謂是“雙贏”的雲端解決方案。

如此就解釋了為什麼AMD能夠贏得包括超算中心在內眾多用戶的支持和喜愛,為什麼能夠連續拿下美國三大E級超算平臺中的兩個,這恰恰是得益於第二代AMD EPYC處理器出色的性能表現和多核心的支持。對於超算中心來說,更多的核心數量意味著同時處理更多的信息,獲得更好的性能;而對於用戶來說,更好的虛擬化表現則意味著更快速的計算效率,效率的提升意味著時間的降低,也就是最大限度降低成本。

賣家多賣錢,買家少花錢,還沒有中間商賺差價。這樣的AMD EPYC處理器,你怎能不說一句YES?


分享到:


相關文章: