國產小機K1 Power服務器能否給中國帶來驚喜?

在當前佔據了近90%市場份額的x86架構服務器面前,曾經的三大主流小型機—IBM Power、Sun SPAR和惠普Alpha分別走上了不同的道路—Sun在2010年被甲骨文(Oracle)收購,惠普也早已宣佈放棄Alpha服務器,唯獨Power仍在不懈堅持。如今,Power在中國市場也獲得了越來越多的認可,浪潮商用機器有限公司(Inspur Power System, IPS)即為代表之一,其將浪潮K1小型機領先的技術積累和系統設計理念,再加上Power的架構優勢,推出了國產小機K1 Power系列,在細分市場不斷取得突破性進展。

K1 Power在中國

一直以來,Power都是企業IT基礎設施的核心繫統。全新POWER9處理器採用了內核微架構,每核性能較POWER8可提升40%,單核線程數提升4倍,L3高速緩存提升3.3倍等等。同時,還具備NVLink 2.0、CAPI 2.0和New CAPI等特性,這種三位一體的硬件加速優勢可大幅提升加速效率,使得深度學習性能超出X86近4倍。軟硬件層面的突破,使得Power服務器整體性能比傳統x86服務器有近1.7-2倍以上的提升,從而在諸多應用中得到了傳統用戶的青睞,特別是政府和金融客戶。

浪潮商用機器有限公司產品營銷部總經理江豫京說IPS成立之初最大的擔憂是能否被國內客戶所接受。然而經過一年的發展,目前公司在非X86市場佔有率為65%。如果從更細分的市場來看,購買POWER8服務器產品的主要來自金融行業和稅務、公安和財政等政府機構。其中,省級市級城商行、農信社和股份制銀行又佔據了金融行業80%以上的份額,主要用於最核心的數據庫資源池平臺。

國產小機K1 Power服務器能否給中國帶來驚喜?

Power9處理器性能一覽

而在K1 Power服務器平臺推出後,舊版Power服務器資源可以進行平滑地無縫遷移,另一方面,基於客戶關鍵業務雲上的數據庫平臺,其RAS特性可承載大量業務的高併發,並可根據需求動態調整。

在互聯網領域,“如果你寄希望於賣一款或幾款標準產品,而不是根據用戶需求給出定製化方案,中國Tier 1的互聯網客戶是絕對不會買賬的。”江豫京認為,沿著浪潮信息互聯網行業部主導的面向互聯網定製化的JDM模式運行,把JDM定製化開發流程和用戶需求導入到Power服務器中,並由此進行個性化設計,將是IPS利用Power架構來開拓新興應用的巨大優勢所在。

此外,通過對AIX進行專門調優也取得了不錯的表現。在江豫京分享的另一個案例中,某證券公司採用K1 Power服務器搭配國產存儲設備構成的計算平臺進行POC測試,在沒有進行任何調優的前提下,僅在遷移過程中就縮短了40%的業務時間,300個應用的遷移只花費了大概5個月的時間。

浪潮商用機器副總經理黃家明表示,IPS是一傢俱備自主創新、自主研發技術實力的公司。這來源於在小型機核心技術領域,浪潮在許多核心技術層面實現了重大突破和創新,包括雙翼可擴展緊耦合體系架構、高速互連芯片,尤其是浪潮成功研製處理器協同芯片,解決了緩存一致性難題,使得中國成為繼美、日之後全球第三個掌握此核心技術的國家,也使得浪潮成為國內高端小型機設計的領軍力量。

K1 Power服務器的修煉之路

“高性能、高可靠、高品質、高安全”是浪潮商用機器有限公司產品研發部副總經理尹宏偉對POWER9處理器和K1 Power服務器的評價。他認為正是通過將POWER9處理器性能、內存與I/O 帶寬、數據庫核心業務、開源數據庫等多重優勢進行結合,再利用分區高度整合核心業務負載,並靈活部署創新應用,才使得K1 Power在2019年上半年UNIX服務器中取得了超過64%的市場份額。

國產小機K1 Power服務器能否給中國帶來驚喜?

  • 高性能

CPU是服務器的心臟,從根本上決定著系統的性能表現。如果和X86架構CPU進行對比,POWER9處理器主頻可以達到業界最高的4GHz,內存帶寬相比x86架構有1.5-1.8倍的提升,支持PCIe 4.0標準。考慮到K1 POWER服務器主要運行在一些核心數據庫上,所以對於諸如EDB、DB2、Oracle、SPARC等商業數據庫和開源數據庫的支持,相比競爭對手均有2倍以上的性能表現。

國產小機K1 Power服務器能否給中國帶來驚喜?

POWER9服務器對數據庫核心業務的支持

“強大的資源整合能力也是K1 Power服務器的一大特點。”尹宏偉表示,K1 Power服務器和x86服務器的部署思路並不一樣:前者整機性能強,硬件負載使用效率高,可以通過分區形式滿足不同的負載應用;後者是一臺服務器對應一種應用,然後通過大量的部署去滿足不同的應用,實際運行中每臺x86服務器的平均負載並不高。

國產小機K1 Power服務器能否給中國帶來驚喜?

  • 高可靠

確保系統的高度可靠是K1 Power服務器的核心訴求。尹宏偉向《電子工程專輯》記者強調了RAS設計理念,包括在系統設計、工藝、質量、測試層面層層把關,獨立的服務處理器FSP可偵測及診斷任何潛在錯誤的發生;通過硬件設計保證系統持續運行提升可用性;在冗餘、錯誤捕獲、校驗與重試、隔離與修復、全棧式可靠保障層面創新突破,實現高可靠性。

國產小機K1 Power服務器能否給中國帶來驚喜?

K1 POWER服務器RAS設計理念

“在Power服務器上運行的都是高價值業務,如何通過動態路由去訪問遠程內存?如何及時發現故障並進行捕獲?如何把故障失效控制在局部範圍內並進行在線修復?這都需要K1 Power服務器能夠在空間冗餘、時間冗餘和信息冗餘三個維度上實現容錯。”黃家明說RAS實現的工作量要遠遠高於核心計算和存儲功能,最難之處就在於每一項功能的實現都要從芯片的SPARC出發,從板級設計到系統設計、從操作系統固件到BIOS,有時還要涉及內存的隔離、遷移和內存數據多副本的故障轉移,如果沒有一支專門面向高可靠性設計的團隊,很難完成這些艱鉅的挑戰。

例如對於整個系統來說,一旦發生故障,如何對故障實施有效的捕獲、隔離和修復,這是Power服務器設計思路中非常重要的理念之一。按照尹宏偉的說法,僅從軟件層面來看,整個Power服務器系統擁有的首錯數據捕獲機制FFDC(First Failure Data Capture)、糾錯機制、重試機制和多達16萬個故障檢查器,能夠實時監測系統運行狀態,並對所有可能產生的錯誤做到提前預警、備案和處理。而在硬件層面,電源、SMP線纜、時鐘、FSP模塊、I/O控制器等系統關鍵部件都要進行冗餘設計,包括CPU與CPU/內存之間的鏈路冗餘、系統時鐘冗餘、電源信號控制冗餘等等。

國產小機K1 Power服務器能否給中國帶來驚喜?

K1 POWER服務器冗餘設計

  • 高品質

如果說通過冗餘設計對故障進行處理、隔離和修復屬於設計層面,那麼對核心部件進行高品質的製造和測試則屬於實現層面。具體包括採用40層複雜主板設計解決工藝和信號干擾挑戰;採用嚴格的元器件和部件選型標準,保證長壽命和高效散熱設計,提升系統局部及整體可靠性;藉助高精度仿真技術降低設計風險,以及採用高標準檢測和全面的認證和檢測確保質量和性能達到業界高水準。

國產小機K1 Power服務器能否給中國帶來驚喜?

高精度仿真技術降低設計風險

  • 高安全

考慮到Power服務器主要用於滿足核心數據庫相關應用,所以江豫京認為儘管浪潮已經開發了KUX操作系統,成為全球第五款、國內首款通過UNIX03標準認證的操作系統,也是國內唯一通過國家信息系統安全等級保護三級認證的Unix系統,但單純依賴操作系統來保障整個系統安全性的做法是遠遠不夠的,必須要在硬件設計、系統加固、固件加固、軟件增強安全方面進行全系統攻關,力保整個系統的安全穩定。

未來的服務器市場版圖

“必須得承認x86架構一定是市場主流,但我們的產品也會有自己的市場,比如K1 Power,就跟法拉利永遠不會在市場上消失是一樣的道理。”江豫京說IPS的定位就是為客戶最關鍵的數據保駕護航,“要讓銀行、政府的核心數據跑在最安全穩定的平臺上。”

他將K1 Power服務器和X86服務器的關係定義為“既競爭,又互補”,尤其是在AI等關鍵應用場景中。也就是說,由於Power支持SMT4/SMT8、NVLink、PCIe 4.0、CPU/GPU內存共享等功能,使得POWER處理器的線程數、併發I/O接口支持能力均高於X86服務器,有很好的縱向擴展性能和RAS特性,能夠承載大型數據庫和核心數據庫中大量業務的併發情況,從而很好的解決AI、機器學習中的訓練(Training)問題,更適合高端應用。

在之前的一個案例中,一臺2路的5290服務器在運行MariaDB開源數據庫時,它的性能跟4路x86服務器是接近的。對於用戶來講,等於在同等功耗和算力情況下得到的整體性能相比2路x86服務器翻了一番。

這表明從Power9的立場來看,X86服務器最主要的應用場景將更側重於前端應用,而大量最核心的數據庫應用仍然是小型機的天下。X86服務器儘管看上去成本相對較低,但它的隱形成本要比現有采用傳統架構做平滑升級的高。

黃家明將Arm架構服務器的發展態勢形容為“從山腳往上衝,還有諸多未明的問題”。比如就不能只強調低功耗,實際上還要看單核、單線程、單一指令的耗能,這涉及工作負載的輕重。當然,未來應用模式有望轉向輕量級、微服務,Arm的確也有彎道超車的可能。但高端Power也可橫向擴展,實現一定的經濟性,雙方前景依然可期。


分享到:


相關文章: