華為芯片和硬件戰略Fellow艾偉:把握ARM架構未來黃金十年

華為芯片和硬件戰略Fellow艾偉:把握ARM架構未來黃金十年

在3月27日舉辦的華為開發者大會上,華為芯片和硬件戰略Fellow艾偉分析了新時期算力架構的發展趨勢。他認為未來十年是屬於ARM架構的黃金十年,而且會重寫X86的輝煌,而華為現在能夠提供基於全ARM的開發平臺,希望工程師們在新的計算架構中建立自己的新技能。

华为芯片和硬件战略Fellow艾伟:把握ARM架构未来黄金十年

ARM正在重演X86的輝煌歷史

艾偉說,從2000年到2020年算力架構在發生變化。

第一,2000年X86佔據市場第一的份額,總算力輸出達到了70%。到了2020年,算力架構發生了逆轉,世界上最大算力架構變成了ARM平臺,基於ARM指令的處理器總算力輸出達到了全球82%。

第二,上游產業產生端到端變化。一是半導體先進工藝的發展,已經不再由PC機牽引,而轉向了ARM架構的智能手機,ARM成為半導體產業的主要驅動力。二是基於ARM的產品形態更加豐富多彩,在這種情況下,軟件工程師就擁有了一個更加開放、多樣化的創新平臺,現在ARM平臺上的軟件越來越多。

艾偉表示,人們的質疑點是ARM現在還是下里巴人,性能比X86要低。但追溯歷史,可以看到當年X86與UNIX相比,性能也要遜色,但自PC機從上世紀80年代開始興起之後,1993年基於X86架構的PC機的總算力輸出超過了基於UNIX的大型機和小型機。1998年英特爾推出的至強處理器達到服務器水平,量變轉化成質變,到現在X86依然佔據整個數據中心90%以上的市場份額,整個替換過程是顛覆性變化。

如今,這個歷史可能會再次被重複。而主角換成了ARM。

2007年智能手機上市,很快到了2013年,智能手機的算力輸出超過了X86,2019年,基於ARM架構的鯤鵬920處理能力達到了高端服務器的水平。從量變到質變的故事會再次發生。

工程師要在新計算架構中建立技能

“對於每一位工程師來說,在這個時候需要把自己的技能轉移到新的計算架構中去。”艾偉這樣建議。

目前半導體的摩爾定律遇到了瓶頸。以前處理器主頻升高會使性能越來越好,但當處理器性能達到一定水平時,再提高主頻會碰到巨大的功耗約束。如何突破這個瓶頸,繼續提高CPU的算力呢?

艾偉說,我們已經看到了一條路徑——多核並行。這個路徑在ARM架構上走得比較快。從手機看,很早就實現了四核到八核的處理器;從服務器來看,華為推出第一代鯤鵬910時,推出了32核的處理器,去年發佈的鯤鵬920,再次把處理器CPU核數提高到64核,其中CPU的核心架構也是華為自研的。

“這種情況帶來整個產業趨勢的變化,我們看到現在不只是華為,已經上市的多個ARM處理器都在增加更多的核數。”艾偉說。其中也包括英特爾、AMD。利用多核處理器提升算力,軟件工程師也因此面臨新挑戰。

除了處理器的多核趨勢,新的計算架構裡,還需要一個高速低時延的總線,能夠實現更加快捷的訪問數據、訪問外設、訪問網絡。所以最底層的物理技術也要提升。艾偉說,鯤鵬920支持8通道內存訪問,整個性能提升了64%,可以用更多的數據及時餵養給CPU做計算。華為提供了PCIe4.0總線性能,支持64G總線性能,可以用更多的方式連接外設和網絡。

“當我們把先進半導體工藝、多核架構、高速內存訪問、高速總線連接在一起,我們為整個軟件產業提供了更加開放而且持續實現性能提升的平臺。”艾偉說,“這個平臺意味著我們仍然可以獲得更加廉價充沛的算力支持。”

半個世紀以前的大型機和小型機時代,用戶少、應用數目少;PC機時代,每年可以達到上億新增用戶,應用數目達到十萬級別;智能手機時代和雲手機時代,用戶數增長達到了十億級別,軟件達到了百萬級別。艾偉說,所有這些上層應用的繁榮、軟件的繁榮,都是從底層開始改變,讓單位成本所購買的算力,提升了十億倍,這是一個非常驚人的數據,而且今後華為還會持續提升性價比,提供更加充沛的算力。

華為提供基於全ARM的開發平臺

讓一個產業接受一個新的指令架構,需要做很多底層工作。艾偉說,我們從操作系統到中間件,再到軟件開發工具,各個方面都逐步充實了ARM上基本的軟件平臺支持。從早期只有少數的幾十個應用,到現在有2000多個應用,而且應用量呈現加速發展勢頭,這得益於我們具備了完整的軟件開發平臺和工具環境。

把一個軟件從一個CPU遷移到另外一個CPU,除了可能會帶來性能提升、成本下降、功耗降低的好處,最關鍵的是在新的CPU上做出的創新功能和創新價值如何體現?

艾偉認為,答案在5G網絡。5G網絡可以用更寬的帶寬、更低的時間實現對終端、對雲計算、對數據中心的連接,而且5G網絡不只是一個簡單的通用計算,它會面向人工智能。

在4G網絡上,中國各個產業得到大發展,如移動互聯網、移動支付、共享經濟、微信、短視頻等等。4G網絡的空口時延是10毫秒,從終端發起一個呼叫到返回到被呼叫終端的響應時間是100毫秒,手機遊戲的玩家可以清晰地看到時延數據,這個時延數據匹配了人體的手、眼、腦的反映時間,所以我們覺得很流暢。

在5G網絡中,帶寬和時延的性能改進了10倍。艾偉說,5G網絡的時延降低到1毫秒,端到端的請求響應時間降到10毫秒,這個時延超過了人體神經的反應,會給AR、VR應用帶來新的體驗。同時在智能終端上,在機器人的應用上,會更廣泛。利用5G網絡,數字世界和物理世界能夠更緊密地連接起來,通過軟件算法的運算給出高價值的信息,優化物理世界,這個世界會發生不可逆轉的變化。

為實現這樣的變化,華為提供了一個更加全面的、基於全ARM的開發平工具平臺。“我們可能不再需要買一個X86的PC了,只要是基於ARM的手機、基於ARM的PC,甚至於基於ARM的智能電視,都可以實現編程功能。”艾偉說,“我們可以實現隨時隨地的編程和創造,我們可以得到觸手可得的開發工具,讓靈感創造持續發揮出來。”而更重要的是,在掌握這些軟件技能後,應用可以部署在終端、部署在邊緣計算、部署在數據中心的雲計算,所有這些部署場景,都是機會。

艾偉說,我們相信在一個全ARM的開發環境,以及全ARM的應用運行部署環境上,軟件工程師會得到更高效率,以及更廣闊的職業發展前景。


分享到:


相關文章: