從亞馬遜做芯片談起

上週,亞馬遜的雲服務業務AWS在其發佈會AWS re:Invent上發佈了兩款新的雲端服務器芯片,分別是高性能處理器芯片Graviton2和高性能機器學習加速芯片Inferentia。我們認為,亞馬遜發佈的這兩款芯片對於雲服務市場和半導體行業都有深遠影響。

Graviton2和Inferentia芯片

从亚马逊做芯片谈起

亞馬遜的Graviton2處理器是亞馬遜研發的第二代高性能雲端處理器芯片。Graviton2基於ARM的高端Neoverse核,使用7nm半導體工藝製造,晶體管數量高達300億,相比上一代芯片核心數增加了4倍,且處理器性能也大大提升。Graviton2處理器為雲計算相關應用做了不少優化,首先是浮點運算能力較上一代有不少提升,此外在指令集上計入了對於機器學習推理應用的支持,以及在芯片上集成了亞馬遜自研的數據編解碼加速器。相比於基於x86處理器的解決方案,Graviton2處理器可以大大提升性能並降低成本,性能/成本比提升可達40%。在軟件上,Grativon2處理器能兼容主流的開源Unix操作系統和Docker容器,這也從很大程度上解決了ARM服務器端處理器生態的問題。

除了高性能處理器之外,亞馬遜發佈的另一款芯片是Inferentia,用於加速機器學習推理計算。

从亚马逊做芯片谈起

根據亞馬遜公佈的指標,Inferentia芯片能提供128TOPS的算力,並支持INT-8和FP-16/bfloat-16計算類型。亞馬遜同時公佈了幾種搭載了Inferentia芯片的服務器配置,最高性能的版本搭載了16顆Inferentia芯片,從而能提供高達2000TOPS的峰值算力。

从亚马逊做芯片谈起

亞馬遜自研芯片對雲服務的影響

亞馬遜今年發佈最新的自研雲端服務器芯片意味著雲服務市場的格局在大數據-人工智能時代相比之前有了深遠的改變,而這個改變最關鍵的部分就是算力成為了越來越重要的性能指標。

上一代雲計算主要承載的業務是讓有IT需求的公司把IT系統在雲端執行,這樣就省去了本地的維護成本。舉例來說,一家公司需要架設一個內部的ERP系統,在沒有云服務的時候需要自己去購買服務器,還需要組建一支專業的IT團隊來負責服務器硬件的維護,這樣就讓IT服務的成本變得比較高。而有了雲服務之後,這類系統可以直接在雲服務商的數據中心完成,公司無需再去購買服務器也不用擔心服務器的穩定/維護/升級問題,這樣就大大降低了成本。公司需要做的無非就是確保選擇正確的雲服務商,並保證有穩定的網絡連接。由此可見,上一代雲服務主打的賣點往往是服務器帶寬,雲服務穩定性,雲服務系統部署簡易性等等,總而言之更偏向於服務質量,但是與硬件關係不大。

隨著雲計算進入大數據和人工智能時代,雲計算的需求也與時俱進。目前,雲計算的概念已經深入人心,因此大量公司的網絡業務都已經上雲,而隨著人工智能和大數據業務逐漸變為主流,雲計算對於大數據和人工智能的支持也需要跟上。而這一代基於深度學習的人工智能浪潮對於算力的需求尤其大,算力正在成為新的基礎設施,因此,我們認為雲服務的核心競爭力正在慢慢轉向算力。

由於算力正在成為雲計算的核心競爭力,因此硬件對於雲計算來說也變得越來越重要。在上一代雲計算中,對於硬件的需求非常單純,只需要普通的服務器級別x86處理器搭配足夠大的內存和SSD即可,而隨著對於算力的需求提升,對於硬件的需求也在快速提升,且呈現專門化。如果總結亞馬遜雲計算中算力相關硬件芯片的迭代,我們可以清楚地看到一條由通用走向專用且性能快速提升的道路。最早的雲計算使用傳統的CPU,隨著人工智能變得火熱,帶有GPU的雲服務器進入了主流視野。相比面向通用計算的CPU,GPU主要支持人工智能訓練和推理計算,通用性下降了一些但是算力提升了數百倍。在之後,亞馬遜發現GPU的性能還不夠好,尤其是在大量的人工智能推理任務上,因此這次發佈了Inferentia ASIC用於高性能低成本推理計算。

放眼未來,我們認為雲計算越來越強調算力的勢頭還將繼續,我們渴望看到更多的雲計算服務商加入提升算力的行列,同時也將看到硬件和芯片將在雲計算領域的地位越來越重要,成為算力的核心支柱。

亞馬遜自研雲端芯片對於半導體行業的影響

亞馬遜大力投資自研雲端服務器芯片意味著雲端服務器芯片的市場格局發生變化,通用的CPU和GPU無法覆蓋整個市場需求。

從技術層面上來說,隨著深度學習神經網絡模型對於算力的需求快速提升,這意味著將催生高性能計算芯片市場較快發展。業界和學界對於高性能計算芯片的探究在數十年內從未停下,但是在人工智能時代到來之前,由於高性能計算的市場始終有限,因此相關技術的資本投入較小,主要是實驗性質的探索,新技術產品化落地的比例並不大。但是隨著高性能計算在人工智能時代成為主旋律,對於新一代高性能計算技術的需求呼之欲出,因此我們預期會看到更多技術上的突破被真正產品化。我們認為,有以下的幾個技術有很大的潛力:(1)chiplet技術。在高性能計算領域,芯片為了追求性能會集成越來越多的晶體管,同時會需要使用最先進的半導體工藝製造。然而,“集成越來越多的晶體管”和“使用最新半導體工藝”這兩件事在摩爾定律遇到瓶頸的今天存在一定矛盾,因為在最新半導體工藝下的大芯片良率會下降,成本也會

大大提升。因此,一個解決方案就是chiplet,把一塊大芯片拆成多個小的chiplet並使用高級封裝技術做集成互聯,從而實現性能和成本間的折衷。(2)眾核技術。在大數據人工智能時代,對於算力要求很高的計算往往是可以並行化的,因此可望通過眾核技術來解決並行計算的問題。下一代眾核技術需要能相比GPU的SIMT擁有更強的數據流支持,並提供更好的眾核間數據通信方案,從而提供更好的性能。(3)可重構和異構計算技術。可重構和異構技術其實是一個硬幣的兩面,分別代表了通用性和專用性。使用可重構計算能實現較好的通用性,但是代價是性能上會有一定損失;異構計算則強調極端性能,但是一旦任務改變,則會讓芯片閒置,從而帶來dark silicon問題。如何在可重構和異構計算之間找到一個這種平衡點將是未來的一個重要技術課題。

從市場層面上來說,由於通用的CPU和GPU已經難以滿足用戶對於算力的需求,因此我們可望看到更多雲服務商會採用非常規的芯片。這另一方面也涉及到了競爭差異化的問題,隨著算力成為最主要的競爭指標,如果使用所有競爭對手都能買到的CPU/GPU,那麼就沒法實現差異化競爭了。因此,從用戶需求和競爭兩個角度來看,都會有越來越多從事雲服務的互聯網巨頭加入自研芯片的行列。自研芯片包括幾種形式,包括與Intel這樣的傳統處理器芯片商合作以開發帶有一定定製化功能的處理器芯片,或者去購買IP來搭建自己定義的SoC,以及全定製的功能模塊。一般來說,處理器核心的門檻很高,通常採用IP授權的形式,但是專用應用加速器的設計則較簡單,可以採用全定製的方案。因此,我們預計會看到越來越多的自研芯片案例,同時ARM的服務器端處理器IP授權業務將得到較大的發展,有望成為移動端處理器核心之外的另一個重要業務;但是人工智能加速器這類的IP我們認為更有可能是雲服務商去做全定製。

*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。

今天是《半導體行業觀察》為您分享的第2153期內容,歡迎關注


分享到:


相關文章: