專訪丨爲萬物互聯時代布局,阿里雲飛天2.0做了哪些升級?

专访丨为万物互联时代布局,阿里云飞天2.0做了哪些升级?

從2009年2月飛天寫下第一行代碼,如今這套阿里雲的核心操作系統已經走過9年的發展歷程。在9月19日舉行的雲棲大會開幕會上,身穿飛天第一行代碼文化衫的阿里雲產品總監何雲飛信步上臺,向外界宣佈阿里雲有史以來最大規模的技術升級——飛天系統2.0上線。

飛天2.0是一套面向未來萬物智能時代的雲操作系統,不僅可滿足百億級設備的計算需求,而且可實現1EB數據存儲以及支持IPv6等重大更新,更大的變革來源於飛天2.0是對未來物理世界與數字世界必將融合的判斷,從而推出的分佈式雲管端融合的解決方案。

何雲飛提到“飛天1.0”和“2.0版本”最大的區別,是飛天1.0擁有大規模數據中心調度能力,但是今天2.0的發展來自於業務更多的需求,更強調面向物聯網時代的分佈式計算。“飛天2.0支撐了阿里雲遍佈全球的基礎設施,針對億萬個端進行廣泛適配,可覆蓋最後一公里的計算。計算是心臟,AI是大腦,IoT是神經網絡,這是我們對萬物智能時代的構想,也是飛天2.0的設計理念。”

在發佈會上,阿里巴巴集團副總裁周明提到今天的阿里雲已經能夠提供18個區域、49個可用區、200個以上的數據中心服務客戶。並建設了全球骨幹網連接全球的數據中心,它還接入了上百個海外的POP以及1500多家運營商。龐大的規模也在督促阿里雲保持創新進步,以更好得滿足客戶需求。

這次飛天2.0系統就是阿里雲多年創新的一次集中亮相,阿里雲創始員工、阿里雲技術研發總經理蔣江偉向大家介紹了阿里雲新版本在計算、存儲、網絡、安全四大方面的進步,並介紹了阿里雲在物聯網、AI、專有云等層面的發展:

百億級計算解決方案:

在計算層面已經實現秒級啟動ECI、彈性計算(ESC)、異構計算(FPGA )、高性能計算(E-HPC)等多種計算方式,同時實現了更彈性的部署方案,能夠在10分鐘內啟動10000臺服務器。神龍雲服務器架構實現了虛擬機和物理機的融合。“計算進入可隨意配置的時代,一行代碼即可啟動。”

10倍性能存儲產品:

存儲方面阿里巴巴自研了SSD——AliFlash,目前AliFlash已經發布三個版本。阿里云為此定製了一款SSD控制芯片,這個芯片支持了阿里巴巴Open Channel協議,這個協議可以讓本地軟件存儲引擎對SSD直接進行讀寫等操作,可將整個傳輸延遲降低10倍,並且讀寫速度放大5倍。

加上阿里雲另一款本地的存儲引擎——Fusionengie引擎,再配上低延時的RDMA網絡,阿里雲形成了從底層芯片到部件、到本地的規模分佈式傳輸的低延時能力,促進上層整個性能放大。比如說本地盤通過這樣的結合,能力提高了50%;對於上層的雲產品比如ESSD,可以放大到5倍的性能提升。

規模化低延時網絡:

目前已經在阿里巴巴規模部署了雙25G、雙100G到服務器的網絡,同時也在研發400G的網絡。在低延時方面,阿里通過對RDMA協議的支持,通過對運維管理的研發、流量控制、運算算法的研發,成功部署了規模化的低延時網絡。

另外發布新一代的vswitch虛擬網絡,性能提升58倍。同時飛天2.0支持IPv6,海量地址幫助企業解決邊緣設備接入難題。

AI推動阿里雲智能化

阿里雲正在推動AI芯片AliNPU的研發。除此以外,阿里雲還根據FPGA非常靈活的特點進行了研發。阿里雲通過軟硬件結合,設計了全棧的系統;針對神經網絡CNN inference吞吐能力與GPU相比不足,阿里雲的硬件架構師和算法工程師進行了一體化設計,尤其是針對具體的架構進行了針對性的算法設計,然後再加上低精度、稀疏化,讓整個性能得到顯著提升。

DC大腦的智能運營化系統也在雲棲大會亮相。這套系統通過阿里雲的數據、算法、模型,可以在供應鏈領域、服務器、網絡、數據中心及應用運維領域、故障排查領域應用,不斷地進行優化提升運營水平。

全面佈局邊緣計算和物聯網:

為佈局物聯網時代,阿里雲在芯片、聯網、管理平臺三個層面進行了佈局。發佈的低功耗LoRa芯片,具有小尺寸、低功耗、超低啟動電流的特點。阿里雲對發佈的另一款聯網產品——天空物聯網寄予厚望,“現在每個人都通過WiFi上網,未來每個企業都通過天空物聯網聯網”。LoRa與飛艇和無人機結合可佈設高機動性大網,物聯網絡管理平臺管理百萬臺以上的網關、億級以上的終端。阿里雲希望推動物聯網時代儘快來臨。

邊緣計算也是促進物聯網時代來臨的重要推動力,這方面阿里雲發佈了邊緣節點服務ENS,可實現分鐘級創建,節省30%帶寬。Link IoT Edge在智能設備上部署邊緣計算,使得萬物智聯。

把公有云“抱回家”的阿里專有云:

阿里雲專有云是阿里雲一種部署模式,它和阿里雲公有云是一樣的架構。很多大企業希望把公有云的能力完整部署在自己的數據中心,這便是阿里專有云的模式。

這次雲棲大會上,阿里專有云帶來一種新的收費模式。過去阿里專有云是購買服務模式,現在可以通過License模式使用阿里專有云,新的模式可以通過訂閱使用,這樣做可以更加靈活,初期的投資更低,整體擁有成本也會降低。

會後阿里雲技術研發總經理蔣江偉、阿里雲產品總監何雲飛、阿里雲專有云事業部總經理三位接受了包括億歐在內的多家媒體專訪:

Q:飛天2.0相比飛天1.0有哪些跨越,飛天2.0賦予阿里雲過去沒有的哪些能力?

何雲飛:飛天1.0和2.0最大的區別,是飛天1.0擁有面向全球的大規模調度能力,能夠將全球數據中心都調動起來。但是飛天2.0更多需求發展來自於業務。我們看到原來的計算都要集中計算,未來的計算是分佈式計算,我們不希望把數據拖來拖去計算,我們希望計算就直接發生在更靠近數據產生的地方,這樣數據計算效率更高,實施性更高,體驗更好。所以飛天系統在往客戶端推進,面向未來海量的互聯網設備,飛天可以延伸到每一個計算的地方,這是飛天2.0最本質的區別。

我舉一個例子,比如說現在視頻數據計算要傳到雲端計算完,然後再回到客戶那邊觀看,造成延時非常大的。那我能不能在靠近數據視頻產生那一端,直接把這個數據計算上傳。未來廣電行業的視頻數據處理量非常大,利用分佈式的雲端處理成本將更低,這是一個非常好的可能。

蔣江偉:我從產品層面介紹下,飛天是一個持續迭代的產品,就像安卓迭代產品一樣。包括神龍處理器馬上推出1.5版本,神龍是一個底層架構,會外化出來很多產品,比如說發佈會上提到的超算。其他的儲如洛神2.0版本、盤古2.0版本等產品的各方面指標都會更好,性價比更高。所以這裡面需要我們工程師越來越多去掌控整個軟硬件。飛天1.0時代基本上以軟件為主,到2.0軟硬件都要結合起來深度定製,這也是飛天2.0版本的重要變化。

Q:飛天從9年前發展到現在的規模,什麼原因促成阿里雲的成功?

蔣江偉:第一個關鍵點,還是馬雲、王堅博士這樣有理想、有堅持的人,他們始終認為這個方向是正確的。像我是因為看見了就相信了,剛開始我也不相信的。包括阿里巴巴眾多技術、產品人才,也跟阿里雲原來那批一起“看見的人”,一起沉澱出了飛天的整個技術。

第二個是由於阿里巴巴集團本身的業務非常廣,很多業務線都能夠幫助試錯。阿里雲現在的總裁胡曉明就是阿里雲第一個客戶,胡總當時是阿里金融CEO,經常把我們飛天工程師抓到他們的辦公室,給他們修bug,改不好就別想回去,飛天就是這麼一個過程走過來的。

另外規模效應也造就了阿里雲產品的技術紅利。因為阿里雲的每一行代碼都是細細推敲的,它的代碼都是金子、都是鑽石。我們用最好的工程師去摳每一行代碼,由於阿里雲平臺的放大器作用,使得寫的每一行代碼被放大到幾百萬客戶的使用,這就是價值。

Q:今天看到阿里雲公佈了很多前沿佈局產品,比如超算、深度學習平臺、物聯網等,另一方面也看到阿里雲正在深入工業、農業等傳統產業。阿里雲如何獲得市場需求?以及如何平衡技術與市場驅動產品發展?

何雲飛:做雲計算平臺是一個技術活,但是你會發現,我們寫算法的工程師,高級科學家,工作在客戶的廠房裡,需求就是在那裡產生,需求是同時被挖掘出來的。今天阿里發佈了很多智能時代產品,但正如AI產品負責人在臺上提到,我們的AI不一樣的地方在於比較“冷”,阿里雲將AI通用的能力,通過API低成本、低門檻的分享給客戶;面向產業的AI是真正走進行業,幫助企業走出去看到業務的機會,這是非常關鍵的。

Q:邊緣計算正在實現雲和端的融合,阿里雲如何定義未來的計算服務形態?

何雲飛:未來的計算一定是從端開始,一部分計算到端上,另一部分是數據上來之後到邊緣網關發生計算,然後再到雲端發生計算。這裡根據不同業務場景的需要,每個點完成計算的量是不一樣的。但是它一定是一個大網,把雲、端以及端跟大數據中心中間還會有一個類似於中心點的這三個點,通過網絡傳輸連成一張大網,來滿足企業不同的業務需求。所以計算這個概念是什麼?就像互聯網是什麼,很難梳理出一個邊界。但是在這裡看,它的每一次拓展都是在離客戶的需求更近。

Q:阿里專有云新版本升級以後,針對客戶的需求做了哪些部署?

馬勁:阿里專有云的能力是來自阿里雲的公有云,同樣的架構但是部署的模式不同。其實對於升級這件事情,客戶的需求很簡單:一個是升級過程當中業務不要中斷,第二個是升級了之後版本之間要兼容。阿里專有云是從V3這個版本開始支持熱升級(V3的熱升級我們叫柔性升級),所有的升級都是不中斷業務的。因為我們現在專有云已經有多達60個產品,所有的產品升級,他有很多的依賴關係,包括和專有云的底座。我們可以做到某一個模塊升級,然後對其他的所有的應用都不影響,我們可以單獨的時間升單獨的模塊。


分享到:


相關文章: