左手AMD,右手英特爾,騰訊雲如何給算力做加法?

雲計算行業的競爭以算力為先,無論上層應用如何演化,算力的基礎底座屬性不變,頭部雲廠商往往更加重視平衡算力層的效率與成本,當規模足夠大,萬分之一的優化也能帶來巨大的效益,雲計算做的恰恰是規模生意。

2020騰訊全球數字生態大會期間,騰訊雲計算力產品能力矩陣首次集中亮相。與此同時,騰訊自研星星海系列服務器產品路線愈發清晰,左手AMD,右手英特爾,騰訊雲正在給自己的算力做加法。

左手AMD,最激進的雲廠商

《計算機世界》瞭解到,騰訊雲可以說是擁抱AMD最"激進”的雲廠商,不過這種情況正在改變。

騰訊云云服務器副總經理李力表示,其他雲廠商逐漸發現“激進”是一個明智的選擇,業界開始更多采用AMD處理器。騰訊雲於2017年與AMD深度合作,當時AMD還是Naples架構。

隨著客戶需求趨向於多樣化,騰訊雲希望對外售賣服務器在標準化的情況下,給客戶更多的選擇,彼時AMD重返服務器市場,騰訊雲在技術和產品層面對其進行評估,AMD本身在設計上也有一些為雲計算場景的專門優化,至少在設計上和需求功能的匹配上,AMD還是合格的。

於是騰訊雲引入AMD處理器作為產品的補充,畢竟AMD不是數據中心的主流玩家,在初期AMD的市場推廣出現了一些困難,比如來自用戶的質疑,騰訊雲選擇中小型用戶或者對成本敏感的用戶入手,來推動AMD雲服務器的採用,性價比優勢突出,基於AMD的雲服務器上量較快。

到了AMD的Rome架構時代,騰訊雲在星星海自研服務器深度與AMD的Rome平臺綁定,並且和AMD的一起定義了騰訊雲自己的AMD芯片。

“此時我們已經從激進變成了明智,因為其他雲廠商在我們之後也做了這個工作,但騰訊雲是最早最積極擁抱AMD的。星星海服務器並不是僅僅為了AMD,為了Rome平臺做的自研服務器,它的定位是騰訊自研服務器。”李力表示。

騰訊雲之前並沒有自研服務器的歷史,從零開始往往意味著波折重重,但用李力的話來說,“以我個人做技術和做雲這麼多年的經驗來看,星星海在雲上上量的過程簡直是個奇蹟。”

奇蹟的點在於——新的自研服務器上線一定不可避免帶來螺旋上升,坎坷和回退都很正常,騰訊雲已經做好了準備,而實際在過去一整年的推廣當中,自研服務器極少發生故障。

“有句話叫雲計算沒有奇蹟,其實是騰訊雲過去多年的經驗教訓和海量業務服務的積累,我們在選擇做自研服務器時非常的敬畏,並且花費了大量的精力在其他人並不重視的點上。”李力感慨道。

右手英特爾,最穩定的選擇

英特爾仍然是數據中心領域的絕對主導,騰訊雲自研星星海服務器當然少不了英特爾。

由英特爾和騰訊合作定製,搭載四顆第三代英特爾至強可擴展處理器和第二代英特爾傲持久內存的騰訊雲星星海四路服務器,是業界首家大規模落地RAS技術,能夠滿足通用計算、異構計算、裸金屬、高性能計算等全業務場景,該款服務器在本次大會上正式發佈。

英特爾至強Cedar Island四路平臺性能優勢在星星海上有很好地體現,比如單節點下最高內存帶寬以及IO數量,單機櫃的處理器核數以及雲主機的虛擬機的密度,相比兩路服務器也有不少提升,性價比更高的同時運維成本更低。

英特爾針對Cedar Island四路平臺做了一些特殊技術開發。比如UPI,UPI作為CPU和CPU之間的高速互連,在Sky Lake和Cascade Lake上面,英特爾做的都是三根UPI,而在四路服務器上,每個CPU配備六根UPI,保證四路服務器CPU和CPU都有兩根UPI的全網狀連接,能夠有效優化四路平臺的性能以及支持NUMA節點,類似的設計都在星星海服務器上得到使用。

據悉,英特爾已經投入了數百名工程師,從硬件設計到軟件升級,來幫助騰訊設計開發和優化整套基礎架構。

騰訊雲服務器與供應鏈管理部總經理劉裕勳表示,星星海四路服務器,作為英特爾與騰訊合作的重要成果,性能優異,不僅可提升騰訊云云服務器、容器服務、雲開發等計算矩陣的戰略能力,更可讓部署更加彈性,讓應用與開發更加簡潔、可信、靈活,並有效降低雲服務總體成本。預計在10月份,星星海四路服務器將正式投入騰訊雲計算矩陣,

值得一提的是,英特爾亦與騰訊持續推動AI聯合創新。雙方不僅在硬件層面合作,以內置AI加速的英特爾至強可擴展處理器為基礎,通過一系列硬件指令加速,為開發者提供更多選擇,提高性能;同時,騰訊雲依託英特爾的AI軟件棧優化,成功上線Open Vino推理加速引擎,成為業內第一個支持Analytics Zoo的公有云廠商,從數據管理到資源利用,形成完整端到端全棧解決方案。

騰訊雲展現算力矩陣,算力越來越

騰訊雲認為,未來智能計算,就是基於5G網絡下,雲計算、大數據、AI、物聯網為一體的智能化計算。面對越來越複雜的數據和不斷擴大的業務規模,不同客戶的多重需求,騰訊雲通過自研戰略推進軟硬件協同,豐富計算能力產品並對外輸出。

基於騰訊雲自研星星海服務器上的雲服務器實例,在性能、成本、穩定性上已經處於行業領先地位。據瞭解,星星海服務器針對雲計算場景做了重點優化,能夠有效地滿足騰訊雲98%的應用場景需求,其外觀用料精簡超過 20%,負載能效提高50%。此外,基於可信鏈傳遞的硬件防篡改能力,星星海服務器具備符合大規模雲應用的硬件安全能力。星星海服務器支持通過專有云TCE在客戶的數據中心進行本地化部署。

騰訊雲還面向中小企業、個人用戶的易於使用和管理的輕量級雲服務器Lighthouse,從雲能力、雲UI、雲計費三個方向全新設計,簡單易用,實現20秒建站,提升30%運維效率,優化80%的設備成本,能夠幫助中小企業及開發者在雲端快速構建博客、論壇等各類應用。

除了星星海自研服務器之外,在AI方面,騰訊雲支持多種深度學習的GPU,並提供了多種使用方式,滿足不同層次需求。騰訊雲還提供了智能鈦機器學習平臺、TBP智能對話平臺等專注於AI場景的解決方案。在大數據方面,騰訊雲有豐富的大數據機型,滿足業務不同的使用場景,同時騰訊雲PaaS服務EMR,可以幫助業務降低使用門檻。

邊緣計算方面,騰訊雲佈局了上千個邊緣節點,結合5G網絡,提供更低延時的計算能力。目前騰訊雲正在將公有云延展到邊緣節點及客戶機房,以便給企業提供本地部署的雲環境,將雲上產品和技術持續延展。

數據中心以及服務器硬件是算力的底層承載,騰訊雲推出了獨創的T-block數據中心的解決方案。騰訊自研創新的T-block技術,涵蓋中壓、低壓、IT、辦公等功能模塊,可以根據用戶需求靈活配置,以標準化、產品化形式幫助數據中心實現快速建設和交付。其綠色節能的特性將運營成本降低了20%以上。通過騰訊智維平臺實現自動化的高效運營,T-block將運維效率提升了20%以上。

雲廠商之間的競爭產業鏈逐步下移,尤其體現在硬件設備上,軟件是互聯網雲廠商的優勢所在,硬件是IT雲廠商的強項,兩者有一致趨同的勢頭——軟硬件結合。

騰訊雲星星海自研服務器仍在進化,未來還會有自研網卡以及ASIC生態的探索,這些底層技術的迭代都會應用到AI、大數據以及邊緣計算的場景,軟硬結合的騰訊雲繼續給算力做加法。


分享到:


相關文章: