自動駕駛的大腦——晶片簡介汽車頭條網

汽車電子發展初期以分佈式ECU架構為主流，芯片與傳感器一一對應，後來，中心化架構DCU、MDC逐步成為了發展趨勢；隨著汽車輔助駕駛功能滲透率越來越高，傳統CPU算力不足過去，在自動駕駛領域GPU取代CPU成為了主流方案；隨著自動駕駛的定製化需求提升，未來定製化ASIC專用芯片將成為主流。

我們將按時間順序梳理車載芯片的發展歷程，探討未來發展方向。

汽車電子發展初期以分佈式ECU架構為主流，芯片與傳感器一一對應，隨著汽車電子化程度提升，傳感器增多、線路複雜度增大，中心化架構DCU、MDC逐步成為了發展趨勢；

隨著汽車輔助駕駛功能滲透率越來越高，傳統CPU算力不足，越來越難以滿足處理視頻、圖片等非結構化數據的需求，
而GPU同時處理大量簡單計算任務的特性在自動駕駛領域取代CPU成為了主流方案；

從ADAS向自動駕駛進化的過程中，激光雷達點雲數據以及大量傳感器加入到系統中，需要接受、分析、處理的信號大量且複雜，定製化的ASIC芯片可在相對低水平的能耗下，將車載信息的數據處理速度提升更快，並且性能、能耗和大規模量產成本均顯著優於GPU和FPGA，隨著自動駕駛的定製化需求提升，定製化ASIC專用芯片將成為主流。

目前出貨量最大的駕駛輔助芯片廠商Mobileye、Nvidia形成“雙雄爭霸”局面，Xilinx則在FPGA的路線上進軍，Google、地平線、寒武紀向專用領域AI芯片發力，國內四維圖新、全志科技、森國科（國科微）在自動駕駛芯片領域積極佈局。

Mobileye的核心優勢是 EyeQ 系列芯片，可以處理攝像頭、雷達等多種傳感器融合產生的大量數據，在L1-L3自動駕駛領域具有極大的話語權，目前出貨量超過了2700萬顆；

NVIDIA在GPU領域具有絕對的領導地位，芯片算力強大且具備很強的靈活性，但功耗高、成本高，AI機器學習並不太適合GPU的應用；

此外Google、地平線、寒武紀、四維圖新等更聚焦在針對不同場景下的具體應用，芯片設計也開始增加硬件的深度學習設計，自動駕駛上AI的應用已經成為未來的趨勢。

基於產業前景和潛在的巨大市場，給予行業買入評級，上市公司方面看好四維圖新，建議關注地平線、寒武紀。

車載芯片的發展趨勢（CPU-GPU-FPGA-ASIC）

過去—以CPU為核心的ECU

2.1 ECU的核心CPU

ECU（Electronic Control Unit）是電子控制單元，其工作過程為CPU接收到各個傳感器的信號後轉化為數據，並由Program區域的程序對Data區域的數據圖表調用來進行數據處理，從而得出具體驅動數據，並通過CPU針腳傳送到相關驅動芯片，驅動芯片再通過相應的周邊電路產生驅動信號，用來驅動驅動器。即傳感器信號——傳感器數據——驅動數據——驅動信號這樣一個完整工作流程。

2.2 分佈式架構向多域控制器發展

汽車電子發展的初期階段，ECU主要是用於控制發動機工作，只有汽車發動機的排氣管（氧傳感器）、氣缸（爆震傳感器）、水溫傳感器等核心部件才會放置傳感器，由於傳感器數量較少，為保證傳感器-ECU-控制器迴路的穩定性， ECU與傳感器一一對應的分佈式架構是汽車電子的典型模式。
隨著汽車電子化的發展，車載傳感器數量越來越多，傳感器與ECU一一對應使得車輛整體性下降，線路複雜性也急劇增加，此時DCU（域控制器）和MDC（多域控制器）等更強大的中心化架構逐步替代了分佈式架構。

現在—以GPU為核心的智能輔助駕駛芯片

人工智能的發展也帶動了汽車智能化發展，過去的以CPU為核心的處理器越來越難以滿足處理視頻、圖片等非結構化數據的需求，

同時處理器也需要整合雷達、視頻等多路數據，這些都對車載處理器的並行計算效率提出更高要求，而GPU同時處理大量簡單計算任務的特性在自動駕駛領域取代CPU成為了主流方案。

3.1 GPU Vs. CPU

3.2 GPU佔據現階段自動駕駛芯片主導地位

目前無論是尚未商業化生產的自動駕駛AI芯片還是已經可以量產使用的輔助駕駛芯片，由於自動駕駛算法還在快速更新迭代，對雲端“訓練”部分提出很高要求，既需要大規模的並行計算，又需要大數據的多線程計算，因此以GPU+FPGA解決方案為核心；在終端的“推理”部分，核心需求是大量並行計算，從而以GPU為核心。

3.3 相關公司

3.3.1 NVIDIA

NVIDIA 在自動駕駛領域的成就正是得益於他們在 GPU 領域內的深耕，NVIDIA GPU專為並行計算而設計，適合深度學習任務，並且能夠處理在深度學習中普遍存在的向量和矩陣操作。相對於Mobileye專注於視覺處理，NVIDIA 的方案重點在於融合不同傳感器。
2016年，英偉達在Drive PX 2平臺上推出了三款產品，分別是配備單GPU和單攝像頭及雷達輸入端口的Drive PX2 Autocruise（自動巡航）芯片（下圖左上）、配備雙GPU及多個攝像頭及雷達輸入端口的Drive PX2 AutoChauffeur（自動私人司機）芯片（右上）、配備多個GPU及多個攝像頭及雷達輸入端口的Drive PX2 Fully Autonomous Driving（全自動駕駛）芯片（下方）。

以目前銷售情況，Drive PX 2搭載上一代 Pascal 架構 GPU已經實現量產，並且已經搭載在 Tesla 的量產車型 Model S 以及 Model X 上。目前 PX 2 仍然是 NVIDIA 自動駕駛平臺出貨的主力，Tesla，Audi 和 ZF等對外公佈 Drive PX 2 應用於量產車。
Xavier是 Drive PX 2 的進化版本，搭配了最新一代的 Volta 架構 GPU, 相較於Drive PX 2性能將提升近一倍，2017年年底量產。由於多家主機廠L3級別以上自動駕駛量產車的計劃在 2020 年左右，而Xavier的量產計劃將能和自動駕駛車的研發週期相互配合（一般 3 年左右），因此Xavier 的合作都是有量產車落地計劃的。

目前，L4及以上的市場基本上被NVIDIA壟斷，CEO黃仁勳稱全球有300餘家自動駕駛研發機構使用Drive PX2。Drive PX 2單價為1.6萬美金，功耗達425瓦，但目前沒有達到車規，按功耗和成本看，只能小規模測試階段使用。

3.3.2 四維圖新

國內地圖行業龍頭，向ADAS和自動駕駛進軍。公司成立於2002年，是國內首家獲導航地圖製作資質的企業（目前僅13家），為領先的數字地圖內容、車聯網與動態交通信息服務、基於位置的大數據垂直應用服務的提供商之一。其拳頭業務——地圖業務，以國內60%的份額穩居壟斷地位。2017年以來，公司收購傑發科技、入股中寰衛星與禾多科技，“高精度地圖+芯片+算法+軟件”的自動駕駛產業鏈全方位佈局雛形已現。
高精度地圖：代表國內最高水平。公司以地圖起家，目前國內高精度地圖僅兩家玩家（另一家為高德），公司深度綁定獲得寶馬、大眾、奔馳、通用、沃爾沃、福特、上汽、豐田、日產、現代、標緻等主流車企發展，佔絕對優勢。2017年公司實現支持L3級別（至少20個城市）的高精度地圖，計劃於2019年覆蓋所有城市，併為L4的推出做準備。
芯片：收購傑發科技佈局汽車芯片。傑發科技（2017年3月完成收購）脫胎於聯發科，主攻車載信息娛樂系統芯片。現階段在國內後裝市場市佔率超70%，前裝超30%（主要為吉利、豐田等車企），其車規級 IVI 芯片被多家國際主流零部件廠商採用，並計劃推出AMP、MCU及TPMS（胎壓監測）芯片等新一代產品。公司通過收購傑發科技，具備了為車廠提供高性能汽車電子芯片的能力，打通從軟件到硬件的關鍵性關卡，並與蔚來、威馬、愛馳億維等造車新勢力公司達成了合作。

3.3.3 全志科技

在今年5月的CES Asia，全志科技發佈首款車規級處理器T7，同時發佈基於T7的多種智能座艙產品形態。T7是數字座艙車規（AEC-Q100）平臺型處理器，支持Android、Linux、QNX系統，集成多路高清影像輸入和輸出，完美支持高清多媒體處理，內置的EVE視覺處理單元可提升輔助駕駛運算效率。

未來—以ASIC為核心的自動駕駛芯片

4.1 ASIC vs GPU+FPGA

GPU適用於單一指令的並行計算，而FPGA與之相反，適用於多指令，單數據流，常用於雲端的“訓練”階段。此外與GPU對比，FPGA沒有存取功能，因此速度更快，功耗低，但同時運算量不大。
結合兩者優勢，形成GPU+FPGA的解決方案。
FPGA和ASIC的區別主要在是否可以編程。FPGA客戶可根據需求編程，改變用途，但量產成本較高，適用於應用場景較多的企業、軍事等用戶；而ASIC已經制作完成並且只搭載一種算法和形成一種用途，首次“開模”成本高，但量產成本低，適用於場景單一的消費電子、“挖礦”等客戶。目前自動駕駛算法仍在快速更迭和進化，因此大多自動駕駛芯片使用GPU+FPGA的解決方案。未來算法穩定後，ASIC將成為主流。

計算能耗比，ASIC > FPGA > GPU > CPU，究其原因，ASIC和FPGA更接近底層IO，同時 FPGA有冗餘晶體管和連線用於編程，而ASIC是固定算法最優化設計，因此ASIC能耗比最高。相比前兩者，GPU和CPU屏蔽底層IO，降低了數據的遷移和運算效率，能耗比較高。同時GPU的邏輯和緩存功能簡單，以並行計算為主，因此GPU能耗比又高於CPU。

4.2 ASIC是未來自動駕駛芯片的核心和趨勢

結合ASIC的優勢，我們認為長遠看自動駕駛的AI芯片會以ASIC為解決方案，主要有以下幾個原因：

綜上ASIC專用芯片幾乎是自動駕駛量產芯片唯一的解決方案。由於這種芯片僅支持單一算法，對芯片設計者在算法、IC設計上都提出很高要求。
以上並非下定論目前ASIC為核心的芯片一定比GPU+FPGA的芯片強，由於目前自動駕駛算法還在快速迭代和升級過程中，過早以固有算法生產ASIC芯片長期來看不一定是最優選擇。

4.3 相關公司

4.3.1 Mobileye

Intel在 ADAS 處理器上的佈局已經完善，包括 Mobileye 的 ADAS 視覺處理，利用 Altera 的 FPGA 處理，以及英特爾自身的至強等型號的處理器，可以形成自動駕駛整個硬件超級中央控制的解決方案。
Mobileye具有自主研發設計的芯片EyeQ系列，由意法半導體公司生產供應。
現在已經量產的芯片型號有EyeQ1至EyeQ4，EyeQ5正在開發進行中，計劃2020年面世，對標英偉達Drive PX Xavier，並透露EyeQ5的計算性能達到了24 TOPS，功耗為10瓦，芯片節能效率是Drive Xavier的2.4倍。英特爾自動駕駛系統將採用攝像頭為先的方法設計，搭載兩塊EyeQ5系統芯片、一個英特爾凌動C3xx4處理器以及Mobileye軟件，大規模應用於可擴展的L4/L5自動駕駛汽車。該系列已被奧迪、寶馬、菲亞特、福特、通用等多家汽車製造商使用。

此外通過行業訪談調研等途徑瞭解到，Mobileye在L1-L3智能駕駛領域具有極大的話語權，對Tire1和OEM非常強勢，其算法和芯片綁定，不允許更改。

4.3.2 寒武紀

5 月 3 日，寒武紀科技在2018 產品發佈會上發佈了多個IP 產品——採用 7nm 工藝的終端芯片 Cambricon 1M、雲端智能芯片 MLU100 等。
其中寒武紀1M芯片是公司第三代IP產品，在TSMC7nm工藝下8位運算的效能比達5Tops/w（每瓦5萬億次運算），同時提供2Tops、4Tops、8Tops三種尺寸的處理器內核，以滿足不同需求。1M還將支持CNN、RNN、SVM、k-NN等多種深度學習模型與機器學習算法的加速，能夠完成視覺、語音、自然語言處理等任務。通過靈活配置1M處理器，可以實現多線和複雜自動駕駛任務的資源最大化利用。它還支持終端的訓練，以此避免敏感數據的傳輸和實現更快的響應。
寒武紀首款雲端智能芯片Cambricon MLU100同期發佈，同時公佈了在R-CNN算法下MLU100與英偉達Tesla V100（2017）和英偉達Tesla P4（2016）的對比，從參數上看，主要對標Tesla P4。

4.3.3 地平線

2017年地平線發佈了新一代自動駕駛芯片“征程”和配套軟件平臺方案“雨果”，同時還發布了應用於智能攝像頭的“旭日”處理器。“征程”是一款專用AI芯片，採用地平線的第一代BPU架構，可實時處理1080p@30視頻，每幀中可同時對200個目標進行檢測、跟蹤、識別，典型功耗1.5W，每幀延時小於30ms。CEO餘凱介紹，地平線的芯片更聚焦在針對不同場景下的具體應用，相比於英偉達的方案，在功耗上低一個數量級，價格也會有更大的競爭力。
2018年亞洲CES，地平線宣佈推出從L2到L4級別全系列的自動駕駛計算平臺。

7月4日百度AI開發者大會上，李彥宏發佈了由百度自主研發的中國首款雲端全功能AI芯片——“崑崙”。“崑崙”基於百度8年的AI加速器經驗的研發，預計將於明年流片。
“崑崙”採用14nm 三星工藝，是業內設計算力最高的AI芯片（100+瓦功耗下提供260Tops性能）；512GB/s內存帶寬，由幾萬個小核心構成。
“崑崙”可高效地同時滿足訓練和推斷的需求，除了常用深度學習算法等雲端需求，還能適配諸如自然語言處理，大規模語音識別，自動駕駛，大規模推薦等具體終端場景的計算需求。此外可以支持paddle等多個深度學習框架，編程靈活度高。

4.3.5 Google TPU

Google TPU於2016年在Google I / O上宣佈，當時該公司表示TPU已在其數據中心內使用了一年以上。
該芯片專為Google的Tensor Flow（一個符號數學庫，用於神經網絡等機器學習應用）框架而設計。
TPU與同期的CPU和GPU相比，可以提供15-30倍的性能提升，以及30-80倍的效率（性能/瓦特）提升。

4.3.6 Xilinx & 深鑑科技

Xilinx賽靈思是FPGA的先行者和領導者，1984年，賽靈思發明了現場可編程門陣列FPGA，作為半定製化的ASIC，順應了計算機需求更專業的趨勢。FPGA 的好處是可編程以及帶來的靈活配置，同時還可以提高整體系統性能，比單獨開發芯片整個開發週期大為縮短，但缺點是價格、尺寸等因素。
在汽車ADAS和自動駕駛解決方案上，賽靈思的FPGA和SOC產品家族衍生出三個模塊：

1.自動駕駛中央控制器Zynq UltraScale+ MPSoC

2.前置攝像頭Zynq-7000 / Zynq UltraScale+ MPSoC

3.多傳感器融合系統Zynq UltraScale+ MPSoC

深鑑科技成立於 2016 年，其創始團隊有著深厚的清華背景，專注於神經網絡剪枝、深度壓縮技術及系統級優化。2018年7月17日，賽靈思宣佈收購深鑑科技。自成立以來，深鑑科技就一直基於賽靈思的技術平臺開發機器學習解決方案，推出的兩個用於深度學習處理器的底層架構—亞里士多德架構和笛卡爾架構的 DPU 產品，都是基於賽靈思 FPGA 器件。

2018年6月，深鑑科技宣佈進軍自動駕駛領域，自主研發的ADAS輔助駕駛系統——DPhiAuto，目前已獲得日本與歐洲一線車企廠商和Tier 1的訂單，即將實現量產。
DPhiAuto，基於FPGA，是面向高級輔助駕駛和自動駕駛的嵌入式AI計算平臺，可提供車輛檢測、行人檢測、車道線檢測、語義分割、交通標誌識別、可行駛區域檢測等深度學習算法功能，
是一套針對計算機視覺環境感知的軟硬件協同產品。功耗方面，可以在10-20W的功耗範圍內，實現等效性能，能效比指標高於目前主流的CPU、GPU方案。