ASIC 芯片市場火爆!初創企業和大型科技公司各有生存之道

人工智能的迅速普及,也對現在的硬件建設提出了新要求,在這樣的市場需求下,現在的企業也在不斷增加對ASIC芯片的研究。

ASIC 芯片市場火爆!初創企業和大型科技公司各有生存之道

根據市調機構Ovum預估,2018~2025年,ASIC的市佔率將從11%大幅增加至48%。Ovum調查報告指出,在2016年,雲端(包含企業、數據中心等)為深度學習晶片的主要營收領域,佔了80%。不過,到了2025年,此一比例將會改變,轉變成邊緣(Edge)佔了80%,而云端的比例則降為20%。這邊所指的邊緣意指終端設備,且以消費性產品為中心(而非小型伺服器或是路由器),包括移動裝置(手機、平板)、頭戴式顯示器(HMD),如AR/VR /MR、智能音箱、機器人、無人機、汽車、安全攝影鏡頭等。各企業也競相研究ASIC芯片。

ASIC 芯片的大型企業介紹

2016 年,英偉達發佈了專門用於加速 AI 計算的 Tesla P100 芯片,並且在 2017 年升級為 Tesla V100。在訓練超大型神經網絡模型時,Tesla V100 可以為深度學習相關的模型訓練和推斷應用提供高達 125 萬億次每秒的張量計算(張量計算是AI深度學習中最經常用到的計算)。然而在最高性能模式下,Tesla V100的功耗達到了300W,雖然性能強勁,但也毫無疑問是顆“核彈”,因為太費電了。

英偉達 Tesla V100 芯片

同樣在 2016 年,谷歌發佈了加速深度學習的 TPU(Tensor Processing Unit)芯片,並且之後升級為 TPU 2.0 和 TPU 3.0。與英偉達的芯片不同,谷歌的 TPU 芯片設置在雲端,就像文章在Alpha Go 的例子中說的一樣,並且“只租不賣“,服務按小時收費。不過谷歌 TPU 的性能也十分強大,算力達到 180 萬億次每秒,並且功耗只有200w。

谷歌 TPU 芯片

關於各自 AI 芯片的性能,谷歌 CEO Sundar Pichai 和英偉達 CEO 黃仁勳之前還在網上產生過爭論。別看兩位大佬為自家產品撐腰,爭得不可開交,實際上不少網友指出,這兩款產品沒必要“硬做比較”,因為一個是在雲端,一個是在終端。

初創企業的AI芯片研究

除了大公司,初創企業也在激烈競爭 ASIC 芯片市場。那麼初創企業在行業中該如何生存呢?創新是初創企業的核心競爭力。

2017 年,NovuMind 推出了第一款自主設計的AI芯片:NovuTensor。這款芯片使用原生張量處理器(Native Tensor Processor)作為內核構架,這種內核架構由 NovuMind 自主研發,並在短短一年內獲得美國專利。除此之外,NovuTensor 芯片採用不同的異構計算模式來應對不同 AI 應用領域的三維張量計算。2018年下半年,Novumind 剛推出了新一代 NovuTensor 芯片,這款芯片在做到 15 萬億次計算每秒的同時,全芯片功耗控制在 15W 左右,效率極高。

縱觀Novumind的發展,能深刻感受到充滿速度與張力的風格。

正是這樣的風格,驅使著Novumind步履穩疾:吳韌離開百度三個月就完成了超級計算機的構架;創業後幾周內就完成了公司各個環節的從零到一;一杯咖啡的時間說服了世界級芯片專家Chien-Ping Lu加入團隊;公司壯大到50餘人依然全員彙報單刀直入,保持解決問題的效率。

產品上,為了保證運算速度,Novumind乾脆不採用支持多平臺軟件的通用芯片,而是由曾負責過NVIDIA、MediaTek、Intel等多項芯片設計的副總裁Chien-Ping Lu帶領技術團隊研發專屬芯片,以達到軟硬件結合的最佳配置;而計算機視覺和產品構架方面,則由前惠普實驗室的首席工程師、曾擔任HP Sprout產品線技術負責人Kar Han Tan主導,以保證產品運營速度的實時捕捉,進而突破超級計算機所面臨的帶寬問題和硬件限制。

儘管 NovuTensor 芯片的紙面算力不如英偉達的芯片,但是其計算延遲和功耗卻低得多,因此適合邊緣端 AI計算,也就是服務於物聯網。雖然大家都在追求高算力,但實際上不是所有芯片都需要高算力的。比如用在手機、智能眼鏡上的芯片,雖然也對算力有一定要求,但更需要的是低能耗,否則你的手機、智能眼鏡等產品,用幾下就沒電了,也是很麻煩的一件事情。並且據 EE Times 的報道,在運行 ResNet-18、ResNet-34、ResNet70、VGG16 等業界標準神經網絡推理時,NovuTensor 芯片的吞吐量和延遲都要優於英偉達的另一款高端芯片 Xavier。

ASIC芯片需求在不斷提升

現今大多數的AI處理器,如GPU,多用於雲端伺服器、資料中心,以在雲端上進行AI訓練和推論。不過,隨著隱私、安全性需求增加,加上為了降低成本、延遲及打破頻寬限制等因素,分散式AI隨之興起,越來越多AI邊緣應用案例出現。例如蘋果的A12仿生芯片,其具備新一代「神經網路引擎」,以即時機器學習技術,改變智能手機的使用體驗。簡而言之,AI從雲端轉向邊緣是現在進行式,當然目前AI在邊緣設備上多還是以推論為主,而非訓練。不過隨著AI創新應用增加,有越來越對芯片商嘗試提升終端裝置處理器的運算效能,為的就是不用再傳送資料至雲端進行資料運算、推理和訓練。也因此,各式的處理器紛紛問世,像是CPU、FPGA、GPU、ASIC、NPU或SoC Accelerator等。

其中,ASIC的市佔率可望隨著邊緣運算的需求增加而明顯攀升,從2018年的11%增加至2025年的52%。ASIC之所以受到青睞,原因在於新興的深度學習處理器架構多以圖形(Graph)或Tensorflow為基礎架構;且上述提到AI邊緣運算受限於功耗和運算效能,因此多以推論為主,而非訓練。然而,若假設到2021年時,終端設備將導入大量AI芯片,所需要的便是能在同一個芯片上進行推理和訓練,可因應分散式運算且又具低功耗的IC,因此ASIC需求將持續上揚,實現更多AI邊緣應用案例。

現在的雲端市場已經成為了一些大型公司的戰場,如果想要在終端芯片的競爭中取得突破,還需要在技術方面尋找關鍵點。

金智創新是一家專注於解決企業技術需求、提供企業投融資服務、推動科技成果轉化的創新綜合服務平臺。擁有資深的行業專家團隊和專業的行業研究隊伍,為近百家企業提供過專業諮詢服務歡迎點擊瞭解更多訪問金智創新官網,瞭解最新產業動態,掌握第一手科技信息。


分享到:


相關文章: