自動駕駛的大腦——晶片簡介


自動駕駛的大腦——芯片簡介



自動駕駛的大腦——芯片簡介


汽車電子發展初期以分佈式ECU架構為主流,芯片與傳感器一一對應,後來,中心化架構DCU、MDC逐步成為了發展趨勢;隨著汽車輔助駕駛功能滲透率越來越高,傳統CPU算力不足過去,在自動駕駛領域GPU取代CPU成為了主流方案;隨著自動駕駛的定製化需求提升,未來定製化ASIC專用芯片將成為主流。

我們將按時間順序梳理車載芯片的發展歷程,探討未來發展方向。

  • 汽車電子發展初期以分佈式ECU架構為主流,芯片與傳感器一一對應,隨著汽車電子化程度提升,傳感器增多、線路複雜度增大,中心化架構DCU、MDC逐步成為了發展趨勢;
  • 隨著汽車輔助駕駛功能滲透率越來越高,傳統CPU算力不足,越來越難以滿足處理視頻、圖片等非結構化數據的需求,
    而GPU同時處理大量簡單計算任務的特性在自動駕駛領域取代CPU成為了主流方案;
  • 從ADAS向自動駕駛進化的過程中,激光雷達點雲數據以及大量傳感器加入到系統中,需要接受、分析、處理的信號大量且複雜,定製化的ASIC芯片可在相對低水平的能耗下,將車載信息的數據處理速度提升更快,並且性能、能耗和大規模量產成本均顯著優於GPU和FPGA,隨著自動駕駛的定製化需求提升,定製化ASIC專用芯片將成為主流。

目前出貨量最大的駕駛輔助芯片廠商Mobileye、Nvidia形成“雙雄爭霸”局面,Xilinx則在FPGA的路線上進軍,Google、地平線、寒武紀向專用領域AI芯片發力,國內四維圖新、全志科技、森國科(國科微)在自動駕駛芯片領域積極佈局。

  • Mobileye的核心優勢是 EyeQ 系列芯片,可以處理攝像頭、雷達等多種傳感器融合產生的大量數據,在L1-L3自動駕駛領域具有極大的話語權,目前出貨量超過了2700萬顆;
  • NVIDIA在GPU領域具有絕對的領導地位,芯片算力強大且具備很強的靈活性,但功耗高、成本高,AI機器學習並不太適合GPU的應用;
  • 此外Google、地平線、寒武紀、四維圖新等更聚焦在針對不同場景下的具體應用,芯片設計也開始增加硬件的深度學習設計,自動駕駛上AI的應用已經成為未來的趨勢。

基於產業前景和潛在的巨大市場,給予行業買入評級,上市公司方面看好四維圖新,建議關注地平線、寒武紀。


自動駕駛的大腦——芯片簡介


車載芯片的發展趨勢(CPU-GPU-FPGA-ASIC)


自動駕駛的大腦——芯片簡介


過去—以CPU為核心的ECU

2.1 ECU的核心CPU

  • ECU(Electronic Control Unit)是電子控制單元,其工作過程為CPU接收到各個傳感器的信號後轉化為數據,並由Program區域的程序對Data區域的數據圖表調用來進行數據處理,從而得出具體驅動數據,並通過CPU針腳傳送到相關驅動芯片,驅動芯片再通過相應的周邊電路產生驅動信號,用來驅動驅動器。即傳感器信號——傳感器數據——驅動數據——驅動信號這樣一個完整工作流程。


自動駕駛的大腦——芯片簡介


2.2 分佈式架構向多域控制器發展

  • 汽車電子發展的初期階段,ECU主要是用於控制發動機工作,只有汽車發動機的排氣管(氧傳感器)、氣缸(爆震傳感器)、水溫傳感器等核心部件才會放置傳感器,由於傳感器數量較少,為保證傳感器-ECU-控制器迴路的穩定性, ECU與傳感器一一對應的分佈式架構是汽車電子的典型模式。
  • 隨著汽車電子化的發展,車載傳感器數量越來越多,傳感器與ECU一一對應使得車輛整體性下降,線路複雜性也急劇增加,此時DCU(域控制器)和MDC(多域控制器)等更強大的中心化架構逐步替代了分佈式架構。


自動駕駛的大腦——芯片簡介


自動駕駛的大腦——芯片簡介


現在—以GPU為核心的智能輔助駕駛芯片

人工智能的發展也帶動了汽車智能化發展,過去的以CPU為核心的處理器越來越難以滿足處理視頻、圖片等非結構化數據的需求,

同時處理器也需要整合雷達、視頻等多路數據,這些都對車載處理器的並行計算效率提出更高要求,而GPU同時處理大量簡單計算任務的特性在自動駕駛領域取代CPU成為了主流方案。

3.1 GPU Vs. CPU

自動駕駛的大腦——芯片簡介

3.2 GPU佔據現階段自動駕駛芯片主導地位

  • 目前無論是尚未商業化生產的自動駕駛AI芯片還是已經可以量產使用的輔助駕駛芯片,由於自動駕駛算法還在快速更新迭代,對雲端“訓練”部分提出很高要求,既需要大規模的並行計算,又需要大數據的多線程計算,因此以GPU+FPGA解決方案為核心;在終端的“推理”部分,核心需求是大量並行計算,從而以GPU為核心。


自動駕駛的大腦——芯片簡介


3.3 相關公司

3.3.1 NVIDIA

  • NVIDIA 在自動駕駛領域的成就正是得益於他們在 GPU 領域內的深耕,NVIDIA GPU專為並行計算而設計,適合深度學習任務,並且能夠處理在深度學習中普遍存在的向量和矩陣操作。相對於Mobileye專注於視覺處理,NVIDIA 的方案重點在於融合不同傳感器。
  • 2016年,英偉達在Drive PX 2平臺上推出了三款產品,分別是配備單GPU和單攝像頭及雷達輸入端口的Drive PX2 Autocruise(自動巡航)芯片(下圖左上)、配備雙GPU及多個攝像頭及雷達輸入端口的Drive PX2 AutoChauffeur(自動私人司機)芯片(右上)、配備多個GPU及多個攝像頭及雷達輸入端口的Drive PX2 Fully Autonomous Driving(全自動駕駛)芯片(下方)。


自動駕駛的大腦——芯片簡介


自動駕駛的大腦——芯片簡介


  • 以目前銷售情況,Drive PX 2搭載上一代 Pascal 架構 GPU已經實現量產,並且已經搭載在 Tesla 的量產車型 Model S 以及 Model X 上。目前 PX 2 仍然是 NVIDIA 自動駕駛平臺出貨的主力,Tesla,Audi 和 ZF等對外公佈 Drive PX 2 應用於量產車。
  • Xavier是 Drive PX 2 的進化版本,搭配了最新一代的 Volta 架構 GPU, 相較於Drive PX 2性能將提升近一倍,2017年年底量產。由於多家主機廠L3級別以上自動駕駛量產車的計劃在 2020 年左右,而Xavier的量產計劃將能和自動駕駛車的研發週期相互配合(一般 3 年左右),因此Xavier 的合作都是有量產車落地計劃的。


自動駕駛的大腦——芯片簡介


  • 目前,L4及以上的市場基本上被NVIDIA壟斷,CEO黃仁勳稱全球有300餘家自動駕駛研發機構使用Drive PX2。Drive PX 2單價為1.6萬美金,功耗達425瓦,但目前沒有達到車規,按功耗和成本看,只能小規模測試階段使用。

3.3.2 四維圖新

  • 國內地圖行業龍頭,向ADAS和自動駕駛進軍。公司成立於2002年,是國內首家獲導航地圖製作資質的企業(目前僅13家),為領先的數字地圖內容、車聯網與動態交通信息服務、基於位置的大數據垂直應用服務的提供商之一。其拳頭業務——地圖業務,以國內60%的份額穩居壟斷地位。2017年以來,公司收購傑發科技、入股中寰衛星與禾多科技,“高精度地圖+芯片+算法+軟件”的自動駕駛產業鏈全方位佈局雛形已現。
  • 高精度地圖:代表國內最高水平。公司以地圖起家,目前國內高精度地圖僅兩家玩家(另一家為高德),公司深度綁定獲得寶馬、大眾、奔馳、通用、沃爾沃、福特、上汽、豐田、日產、現代、標緻等主流車企發展,佔絕對優勢。2017年公司實現支持L3級別(至少20個城市)的高精度地圖,計劃於2019年覆蓋所有城市,併為L4的推出做準備。
  • 芯片:收購傑發科技佈局汽車芯片。傑發科技(2017年3月完成收購)脫胎於聯發科,主攻車載信息娛樂系統芯片。現階段在國內後裝市場市佔率超70%,前裝超30%(主要為吉利、豐田等車企),其車規級 IVI 芯片被多家國際主流零部件廠商採用,並計劃推出AMP、MCU及TPMS(胎壓 監測)芯片等新一代產品。公司通過收購傑發科技,具備了為車廠提供高性能汽車電子芯片的能力,打通從軟件到硬件的關鍵性關卡,並與蔚來、威馬、愛馳億維等造車新勢力公司達成了合作。


自動駕駛的大腦——芯片簡介


3.3.3 全志科技

  • 在今年5月的CES Asia,全志科技發佈首款車規級處理器T7,同時發佈基於T7的多種智能座艙產品形態。T7是數字座艙車規(AEC-Q100)平臺型處理器,支持Android、Linux、QNX系統,集成多路高清影像輸入和輸出,完美支持高清多媒體處理,內置的EVE視覺處理單元可提升輔助駕駛運算效率。


自動駕駛的大腦——芯片簡介


自動駕駛的大腦——芯片簡介


未來—以ASIC為核心的自動駕駛芯片

4.1 ASIC vs GPU+FPGA

  • GPU適用於單一指令的並行計算,而FPGA與之相反,適用於多指令,單數據流,常用於雲端的“訓練”階段。此外與GPU對比,FPGA沒有存取功能,因此速度更快,功耗低,但同時運算量不大。
    結合兩者優勢,形成GPU+FPGA的解決方案。
  • FPGA和ASIC的區別主要在是否可以編程。FPGA客戶可根據需求編程,改變用途,但量產成本較高,適用於應用場景較多的企業、軍事等用戶;而ASIC已經制作完成並且只搭載一種算法和形成一種用途,首次“開模”成本高,但量產成本低,適用於場景單一的消費電子、“挖礦”等客戶。目前自動駕駛算法仍在快速更迭和進化,因此大多自動駕駛芯片使用GPU+FPGA的解決方案。未來算法穩定後,ASIC將成為主流。


自動駕駛的大腦——芯片簡介


  • 計算能耗比,ASIC > FPGA > GPU > CPU,究其原因,ASIC和FPGA更接近底層IO,同時 FPGA有冗餘晶體管和連線用於編程,而ASIC是固定算法最優化設計,因此ASIC能耗比最高。相比前兩者,GPU和CPU屏蔽底層IO,降低了數據的遷移和運算效率,能耗比較高。同時GPU的邏輯和緩存功能簡單,以並行計算為主,因此GPU能耗比又高於CPU。


自動駕駛的大腦——芯片簡介


4.2 ASIC是未來自動駕駛芯片的核心和趨勢

  • 結合ASIC的優勢,我們認為長遠看自動駕駛的AI芯片會以ASIC為解決方案,主要有以下幾個原因:


自動駕駛的大腦——芯片簡介


  • 綜上ASIC專用芯片幾乎是自動駕駛量產芯片唯一的解決方案。由於這種芯片僅支持單一算法,對芯片設計者在算法、IC設計上都提出很高要求。
  • 以上並非下定論目前ASIC為核心的芯片一定比GPU+FPGA的芯片強,由於目前自動駕駛算法還在快速迭代和升級過程中,過早以固有算法生產ASIC芯片長期來看不一定是最優選擇。

4.3 相關公司

4.3.1 Mobileye

  • Intel在 ADAS 處理器上的佈局已經完善,包括 Mobileye 的 ADAS 視覺處理,利用 Altera 的 FPGA 處理,以及英特爾自身的至強等型號的處理器,可以形成自動駕駛整個硬件超級中央控制的解決方案。
  • Mobileye具有自主研發設計的芯片EyeQ系列,由意法半導體公司生產供應。
    現在已經量產的芯片型號有EyeQ1至EyeQ4,EyeQ5正在開發進行中,計劃2020年面世,對標英偉達Drive PX Xavier,並透露EyeQ5的計算性能達到了24 TOPS,功耗為10瓦,芯片節能效率是Drive Xavier的2.4倍。英特爾自動駕駛系統將採用攝像頭為先的方法設計,搭載兩塊EyeQ5系統芯片、一個英特爾凌動C3xx4處理器以及Mobileye軟件,大規模應用於可擴展的L4/L5自動駕駛汽車。該系列已被奧迪、寶馬、菲亞特、福特、通用等多家汽車製造商使用。


自動駕駛的大腦——芯片簡介


  • 此外通過行業訪談調研等途徑瞭解到,Mobileye在L1-L3智能駕駛領域具有極大的話語權,對Tire1和OEM非常強勢,其算法和芯片綁定,不允許更改。


自動駕駛的大腦——芯片簡介


4.3.2 寒武紀

  • 5 月 3 日,寒武紀科技在2018 產品發佈會上發佈了多個IP 產品——採用 7nm 工藝的終端芯片 Cambricon 1M、雲端智能芯片 MLU100 等。
  • 其中寒武紀1M芯片是公司第三代IP產品,在TSMC7nm工藝下8位運算的效能比達5Tops/w(每瓦5萬億次運算),同時提供2Tops、4Tops、8Tops三種尺寸的處理器內核,以滿足不同需求。1M還將支持CNN、RNN、SVM、k-NN等多種深度學習模型與機器學習算法的加速,能夠完成視覺、語音、自然語言處理等任務。通過靈活配置1M處理器,可以實現多線和複雜自動駕駛任務的資源最大化利用。它還支持終端的訓練,以此避免敏感數據的傳輸和實現更快的響應。
  • 寒武紀首款雲端智能芯片Cambricon MLU100同期發佈,同時公佈了在R-CNN算法下MLU100與英偉達Tesla V100(2017)和英偉達Tesla P4(2016)的對比,從參數上看,主要對標Tesla P4。

4.3.3 地平線

  • 2017年地平線發佈了新一代自動駕駛芯片“征程”和配套軟件平臺方案“雨果”,同時還發布了應用於智能攝像頭的“旭日”處理器。“征程”是一款專用AI芯片,採用地平線的第一代BPU架構,可實時處理1080p@30視頻,每幀中可同時對200個目標進行檢測、跟蹤、識別,典型功耗1.5W,每幀延時小於30ms。CEO餘凱介紹,地平線的芯片更聚焦在針對不同場景下的具體應用,相比於英偉達的方案,在功耗上低一個數量級,價格也會有更大的競爭力。
  • 2018年亞洲CES,地平線宣佈推出從L2到L4級別全系列的自動駕駛計算平臺。


自動駕駛的大腦——芯片簡介


  • 7月4日百度AI開發者大會上,李彥宏發佈了由百度自主研發的中國首款雲端全功能AI芯片——“崑崙”。“崑崙”基於百度8年的AI加速器經驗的研發,預計將於明年流片。
  • “崑崙”採用14nm 三星工藝,是業內設計算力最高的AI芯片(100+瓦功耗下提供260Tops性能);512GB/s內存帶寬,由幾萬個小核心構成。
  • “崑崙”可高效地同時滿足訓練和推斷的需求,除了常用深度學習算法等雲端需求,還能適配諸如自然語言處理,大規模語音識別,自動駕駛,大規模推薦等具體終端場景的計算需求。此外可以支持paddle等多個深度學習框架,編程靈活度高。

4.3.5 Google TPU

  • Google TPU於2016年在Google I / O上宣佈,當時該公司表示TPU已在其數據中心內使用了一年以上。
    該芯片專為Google的Tensor Flow(一個符號數學庫,用於神經網絡等機器學習應用)框架而設計。
  • TPU與同期的CPU和GPU相比,可以提供15-30倍的性能提升,以及30-80倍的效率(性能/瓦特)提升。


自動駕駛的大腦——芯片簡介


自動駕駛的大腦——芯片簡介


4.3.6 Xilinx & 深鑑科技

  • Xilinx賽靈思是FPGA的先行者和領導者,1984年,賽靈思發明了現場可編程門陣列FPGA,作為半定製化的ASIC,順應了計算機需求更專業的趨勢。FPGA 的好處是可編程以及帶來的靈活配置,同時還可以提高整體系統性能,比單獨開發芯片整個開發週期大為縮短,但缺點是價格、尺寸等因素。
  • 在汽車ADAS和自動駕駛解決方案上,賽靈思的FPGA和SOC產品家族衍生出三個模塊:

1.自動駕駛中央控制器Zynq UltraScale+ MPSoC

2.前置攝像頭Zynq-7000 / Zynq UltraScale+ MPSoC

3.多傳感器融合系統Zynq UltraScale+ MPSoC



自動駕駛的大腦——芯片簡介


  • 深鑑科技成立於 2016 年,其創始團隊有著深厚的清華背景,專注於神經網絡剪枝、深度壓縮技術及系統級優化。2018年7月17日,賽靈思宣佈收購深鑑科技。自成立以來,深鑑科技就一直基於賽靈思的技術平臺開發機器學習解決方案,推出的兩個用於深度學習處理器的底層架構—亞里士多德架構和笛卡爾架構的 DPU 產品,都是基於賽靈思 FPGA 器件。
自動駕駛的大腦——芯片簡介


自動駕駛的大腦——芯片簡介


  • 2018年6月,深鑑科技宣佈進軍自動駕駛領域,自主研發的ADAS輔助駕駛系統——DPhiAuto,目前已獲得日本與歐洲一線車企廠商和Tier 1的訂單,即將實現量產。
  • DPhiAuto,基於FPGA,是面向高級輔助駕駛和自動駕駛的嵌入式AI計算平臺, 可提供車輛檢測、行人檢測、車道線檢測、語義分割、交通標誌識別、可行駛區域檢測等深度學習算法功能,
    是一套針對計算機視覺環境感知的軟硬件協同產品。功耗方面,可以在10-20W的功耗範圍內,實現等效性能,能效比指標高於目前主流的CPU、GPU方案。


自動駕駛的大腦——芯片簡介


分享到:


相關文章: