“新基建”帶來數據中心大發展的新契機

“新基建”帶來數據中心大發展的新契機

區別於傳統基建,“新基建”主要發力於科技端,主要包括5G建設等七大領域。隨著互聯網進入雲2.0時代,行業雲興起,更多的企業成為雲化、數字化的主角,5G、雲計算、工業互聯網等新一代信息技術的應用離不開海量數據的處理、存儲和軟件的雲化。隨著“新基建”的推進,雲計算服務部署提速,相關設備及服務需求增加,數據中心作為底層基礎設施有望持續增長,數據中心建設及擴容的步伐也會相應加快。

從中長期看,數據中心等數字經濟領域的基礎設施應該在技術和資金允許的情況下適度超前佈局,帶動應用市場的繁榮。在當前大國科技競爭的大背景下,加大對新基建領域的投入,有助於穩增長、穩就業,釋放國內經濟增長潛力,有效緩解新冠肺炎疫情對全國經濟的衝擊,縮小與發達國家的數字鴻溝。可以預見,“新基建”來襲會對數據中心產業產生重大影響,勢必將開啟新一輪增長期。

數據中心規模化效益凸顯,超大規模組網亟需破局


互聯網行業的蓬勃發展帶動了數據和流量不斷向數據中心聚集。為充分發揮數據中心的規模效益,大幅降低業務部署成本和維護成本,運營商、互聯網、雲服務提供商等行業中的大型公司紛紛建設了超大規模數據中心。自2013年以來,超大規模數據中心的數量增長了兩倍,其中以亞馬遜、蘋果、谷歌、Facebook和微軟為首,單園區最大服務器規模已經突破30萬臺,很多大型園區服務器規模在2萬臺到10萬臺之間。到2019年第三季度末,這些大型數據中心中有504個正在運營,還有超過150個新的超大規模中心正在建設中。

可以預見,在“新基建”的推動下,“撒胡椒麵”式數據中心投資建設方式或將成為過去,更多的集中式、大手筆的投資方式將加速超大規模數據中心的建設。在這個大背景下,如何繼續提高數據中心規模化效益,構建更大規模的數據中心網絡,是每個數據中心架構設計師都要面對的挑戰。

組建超大規模數據中心主要受限於兩方面的因素:一個是業界主流的交換網絡設備的轉發能力和端口密度;另一個則是網絡架構設計思想,需具備極高的可擴展性和可管理性,以期能按POD進行數據中心網絡的交付,並最終具備靈活擴展到承載更大規模集群的能力。目前業界主流設備已經可以提供基於12.8T芯片、支持32個400G端口的TOR交換機,預計2022年將會出現50T以上的大容量芯片,支持64個800G端口以及最新的112G SerDes技術。

同時,數據中心網絡已經從最初傳統的3-Tier架構演進到扁平化、無阻塞的葉脊(Leaf-Spine)架構,並基於這種架構還在不斷進行迭代演進。Facebook去年公開了其新一代的數據中心架構F16,在spine平面對其上一代數據中心架構F4進行擴展,把4個128端口、400Gbit/s交換機升級為16個128端口、100Gbit/s架構的交換機,並採用Minipack spine交換機和基於Tomahawk-3(Minipack)、Tomahawk-2(Wedge 100S)ASIC的Wedge 100S交換機,據稱可以擁有4倍於F4架構的容量,更加方便升級和使用。可以預見,未來在業界的共同努力下,數據中心在網絡架構、設備轉發能力以及端口密度等方面有望取得新的突破,以支持更超大規模的數據中心組網。

無損、智慧、開源或成為數據中心網絡能力的“三駕馬車”新基建勢必將推進5G、AI、大數據、雲計算等業務飛速發展,這些新業務對網絡,尤其是數據中心網絡在轉發效率、高效運維、開放架構等諸多方面提出了更為苛刻的需求,未來數據中心網絡需要在無損、智慧、開源這三大方面全面提升能力,為新一代業務應用保駕護航。

無損數據中心提升網絡確定性和高效轉發能力


未來在公有云、人工智能等應用中將廣泛採用語音交互、圖像交互等新型的技術,這些交互服務通過訪問線上數據庫、雲數據中心等來滿足不同需求,諸如浸入式體驗、全息通信、機器人看護等應用。由於這些應用需要通過網絡傳輸和處理大規模多媒體信息,且設備密度和總信息量巨大,需要數據中心網絡在極短時間內將大量的數據轉換成實時的信息以及行為,保證交互服務在後臺訪問的時候能夠避免丟包,減少時延並提高吞吐量,由此對數據中心網絡提出了無損轉發的需求。

目前,無損網絡技術已經在互聯網、金融等行業得到應用。以某銀行業為例,基於無損網絡技術,在數據中心引入智能擁塞調度手段來加速網絡通信,經實測最終存儲集群IOPS性能提升了20%,單卷性能達到35萬IOPS,可以為用戶提供像訪問本地盤一樣的使用體驗。隨著人工智能的飛速發展,工業控制、遠程醫療、自動駕駛等越來越多的應用將走入我們的生活,而無損數據中心網絡無疑為我們提供了一個極佳選擇。

智慧化能力有望解決海量數據中心運維困境


數據中心規模擴張以後,設備數量呈倍數增長,設備種類也大大增多,如何實現海量設備的統一管理,實現業務到網絡的聯動,提高運維效率,降低運維成本,是大規模數據中心急需解決的問題之一。此外隨著雲、SDN、NFV等技術在數據中心加速落地,轉控分離、三層解耦以及統一編排等技術引入也使得數據中心業務邏輯愈加複雜,故障排障難度大幅提升,傳統運維模式已經難以為繼。

基於AI和Telemetry的智能運維是利用數據智能替換人工經驗,期望在自動化的基礎上實現遙測、大數據分析、機器學習和網絡引導等功能,監控和管理潛在的網絡安全問題,幫助數據中心更快地適應不斷變化的業務需求,提高運營的洞察力,最終實現基於意圖的網絡。

當前網絡智慧化產業處於蓬勃發展中,重點集中在網絡開局部署、網絡變更校驗、故障智能定界/定位、故障預測、業務分析以及預測等方面,尋求在數據採集、大數據分析、AI、決策閉環等環節實現精細化檢測和可視化管理,變被動運維為主動運維。雖然目前還受制於AI學習模型的精確、網絡設備特性不足等制約因素,但人工智能的發展必將引發再一次網絡運維的變革。

開放架構設備催生數據中心新的產業生態


數據中心開放式的架構給白盒交換機提供了發展良機,白盒交換機與傳統交換機的區別在於:白盒交換機採用開放的體系架構,可實現硬件與軟件的解耦,需要部署一套集中的網絡操作系統。

目前SONIC操作系統逐漸成為白盒交換機的事實標準,SONIC通過SAI層,將交換機進行接口抽象設計,向上提供統一的API接口,向下對接不同ASIC芯片,徹底解決了上層軟件需適配不同ASIC芯片的問題。此外,芯片層面也不斷開放,通過可編程接口來自定義芯片對於數據包的處理邏輯,實現按需添加新功能、新協議或者對原有協議進行優化等能力,極大提升了靈活性。

隨著白盒交換機生態系統的發展,硬件、網絡操作系統以及協議軟件等逐步成熟,越來越多的客戶投入到白盒交換機的研發和使用中,尤其在互聯網行業,基於開放架構的白盒交換機已經在大型互聯網公司的雲數據中心規模部署。隨著業務的精細化發展,對網絡的定製化的需求越來越多,自主可控的開源設備將會發揮出更大的作用。


分享到:


相關文章: