AI晶片爲何受到如此追捧?

人工智能技術迅猛發展的當下,要實現更高效、更人性化的AI,需要的不僅僅是架構、算法,還有幫助AI成型的基石,即AI芯片。作為人工智能得以運行的載體,AI芯片的發展無疑左右著人工智能技術的進步。近日,華為AI戰略完整披露,眾多AI芯片正式亮相,其強勁的性能令眾人驚歎之時,也不禁讓人產生疑惑,為何華為要為此改變自身集團願景,AI芯片為何受到這麼多的追捧?

初始階段,由於不需考慮功耗等原因,人工智能的芯片可以追求高算力、高併發、高吞吐量,現階段的解決方案一般是以"GPU+CPU"的異構模式來完成。同時,這種方案主要面向各大AI企業及實驗室的訓練環節,目前市場中由於AMD在此方面的長期缺失,導致深度學習GPU加速市場由NVIDIA一家獨大。

但隨著人工智能逐漸在雲端展開應用,對AI芯片則提出了更多要求,在兼顧高性能的同時,還需要兼顧功耗及反應時間。而作為半定製的專用集成電路FPGA(現場可編程門陣列)恰好能夠滿足要求,其特點是能耗低,同時具有低延時、高吞吐的特性,可以滿足人工智能在雲端運行的需求。目前,FPGA市場Xilinx和Altera兩家佔據絕對壟斷地位,市場份額接近90%。

未來,人工智能技術註定要進一步下放至終端設備,由於物理原因受限,因此芯片的功耗、面積、成本都需要進一步優化。主要解決方案為獨立ASIC與SoC+IP兩種;獨立ASIC可以通過定製化的設計來實現性能更加優越、保密性更強的芯片,但缺點是開發週期較長,投入成本巨大,一般公司難以承受。SoC+IP在ASIC的開發弊端上具有很大的優勢,但缺點是功能拓展性較弱,此前華為發佈的昇騰系列AI芯片便按照此種方案開發。

雖然ASIC有種種開發上的困難,但是作為專用集成電路,其性能與功耗的優勢卻是顯而易見的。在人工智能神經網絡計算中,與傳統計算有一定的區別,導致進行神經網絡計算時,CPU、DSP、GPU都有算力、性能、能效等方面的不足,所以產生了專為神經網絡計算而設計處理器或加速器的需求。由於ASIC屬於定製類的芯片,涉及重新設計電路,因此生產的困難性頗大,目前市場中人工智能ASIC領域龍頭當屬Google TPU,其今年5月份發佈的第三代TPU處理器本身的功能為第二代的兩倍。

以手機為例,在智能手機這類設備之中一般都有GPU及CPU,可以為人工智能提供相應的運算能力支持,那為何還要專門開發AI芯片來進行這項工作呢?這裡舉一個簡單的例子,去普通飯店吃飯時可以選擇各種菜系,可能會比較美味,但若想要品嚐正宗的菜餚,要去專門的飯店才有可能吃到。

AI芯片也是如此,雖然手機也會有GPU及CPU,但功耗低、重量輕、厚度薄才是其追求的方向。專用的AI芯片能夠實現最高效率及能力,並且只佔用很小的空間及更低的功耗。同時不會佔用CPU及GPU太多的資源,可以保證手機在運行人工智能的同時還能進行其他操作。

當然AI芯片的重要性不止於此。以Google TPU1為例,其擁有256X256尺寸的脈動陣列,約為700MHz,擁有64K個乘法單元,每個單元單次可執行一個乘法及加法,即128K個操作。那麼TPU1每秒的巔峰計算次數為約90Tops,當然這裡只是理論數值,由於數據傳輸、存儲、提取等原因,往往達不到峰值速率。

但是,相較於普通GPU及CPU方案來進行訓練時,尤其目前神經網絡尺寸越發龐大,參數更加繁雜,通常大型NN模型的訓練時間長達幾周甚至數月,而期間出現各種意外情況也會影響到訓練的進度,如停電等。而採用了TPU1則可以在一頓飯的時間內完成,其效率大大提升。

而AI芯片雖然被冠以AI之名,但其本質還是一枚芯片。在經歷中美貿易戰初期的交鋒後,國內企業已經紛紛醒悟過來若沒有自己的核心技術,即使做到再強也不過一堆沙灘上的雕塑而已,浪潮一來即可覆滅。

在面對CPU及GPU被國外企業壟斷的格局下,AI芯片成為了國內廠商新的突破點。目前來看,人工智能技術中美兩國基本處於同一起跑線上,因此對於AI芯片的開發更加有利。但是芯片的設計並非一朝一夕之功,加之我國的芯片製造能力也非常薄弱,需要投入大量人力財力才可能得出有效的產品。國內目前對AI芯片投入研究的企業有寒武紀、華為海思、中興微電子、阿里平頭哥等,還有許多小型企業也紛紛跟風進入AI芯片領域中。

這是由於AI芯片製作並不同傳統芯片一般,不需要花費精力製作IP內核,直接採用其他IP再加上架構層面的優化,針對業務需求對IP進行整合,因此製作的門檻大大降低,如上述提到的SoC+IP方案。華為昇騰系列的推出為AI國產芯片注入了一針強心劑,極大地振奮了國產AI芯片相關製造企業。

但值得注意的是,雖然華為推出了AI芯片,但其在手機端的應用依然有許多侷限性,大多隻應用於圖片識別上。不僅華為如此,蘋果及聯發科也是如此,如何拓展未來AI的更多應用,成為了下一步將要邁出的關鍵。


分享到:


相關文章: