12.10 L4無人駕駛瓶頸之一:計算平臺

L4無人駕駛瓶頸之一:計算平臺

參會請掃描圖中二維碼


L4無人駕駛計算平臺是限制L4無人駕駛大規模推廣的瓶頸之一,其他瓶頸也很多。悲觀的話,10年內L4級無人駕駛無法量產,樂觀的話至少也要再等上5年。


L4無人駕駛瓶頸之一:計算平臺


典型L4級無人駕駛計算平臺如上圖,基本上就是兩套一模一樣的系統,包含了CPU、GPU和加速器。多個加速器還需要一個PCIe交換機,其價格非常昂貴,甚至比加速器都貴。與線控底盤連接需要一個達到ASIL-D級的MCU,通常是英飛凌的TC297/397,瑞薩的RH850和NXP的MPC574X系列也能達到。

計算平臺核心是以太網交換機,以上圖為例,Marvell的7口以太網交換器88E6321通過以太網物理層Marvell的88E1512與兩個CPU也就是英偉達的Tegra Parker連接。Parker外接GPU加速器,以太網交換器也連接主要傳感器和底盤控制MCU(PX2中就是英飛凌的TC297T),可謂是PX2的關鍵芯片。88E6321的後續產品是88Q5050,由德國大陸汽車旗下子公司Elektrobit與Marvell聯合打造,88Q5050則用在英偉達最新旗艦Pegasus,這也是基於最新的車載以太網標準TSN的首次實際應用。


L4無人駕駛瓶頸之一:計算平臺


通常CPU對應標量計算,主要是路徑規劃和決策算法,此外部分激光雷達使用ICP點雲配准算法,CPU比GPU能更好對應。常用的傳感器融合如卡爾曼濾波算法也多是標量運算。GPU對應矢量或者說向量計算,包括高精度地圖、傳統視覺算法。矩陣就是卷積運算的核心,也是所謂人工智能的核心運算。通俗一點理解的話,我們可以將標量視為零階張量,矢量視為一階張量,那麼矩陣就是二階張量。FPGA比較特殊,它天生並行結構,對應矢量和矩陣都沒問題,對應高階張量更能發揮特長。


CPU應該達到200K DMIPS以上的算力。ARM設計的針對L4使用的Cortex-a76AE,ARM推薦的是驚人的16核設計,車規級肯定運行頻率不能太高,否則功耗太高,估計最高不超過2.2GHz,甚至是1.8GHz,這樣的算力超過250K,我們給它打個八折,算200K。AI部分主要是推理,一般都是INT8的精度。如果特別側重攝像頭,INT8至少要有20TOPS的算力,如果更側重激光雷達,那麼個人認為4TOPS就足夠。


L4無人駕駛瓶頸之一:計算平臺


常見或有潛力成為無人駕駛計算平臺的芯片對比

L4無人駕駛瓶頸之一:計算平臺


EyeQ5的CPU很弱,只有52K,是所有芯片裡最差的,不過這關係不大,因為它屬於英特爾,英特爾的汽車SoC也就是Atom 3900系列可以派上用場,3900系列中最高級的A3960大約有50K DMIPS。英特爾的Atom 3900系列差不多6年都沒更新換代了。或許2020年會更新。


L4無人駕駛瓶頸之一:計算平臺

Xavier表現最全面,CPU算力有137K,仍然不及格。SA8155P是高通驍龍855的車規版,跟麒麟990一樣都是7納米,4個A76加4個A55內核。估計A76的運行頻率也會降低,即便是A76火力全開,也難以超過130K。特斯拉的AI很強,不過12個A72最多也就是150K。以特斯拉的出貨量,這顆芯片估計最低都要300美元。


最優秀的實際是Xilinx的VersalAI Core,AI算力擁有壓倒性優勢,最低都有49TOPS。這是全球首顆7納米FPGA。


稱之為FPGA或許不切合實際,Xilinx稱之為Adaptive Compute Acceleration Platform (ACAP)。


L4無人駕駛瓶頸之一:計算平臺


ACAP結合了CPU和GPU(DSP)的高效率應用場景,能夠自適應各種計算形式。


L4無人駕駛瓶頸之一:計算平臺


ACAP裡包含了兩個A72內核,對應標量計算,兩個A72擁有48KB/32KB的一級緩存,1MB的二級緩存,這比傳統的ASIC要高不少。同時也有Cortex-R5雙核保證實時性任務的可靠執行,如Boot。有AI和DSP引擎,AI引擎從128-400個,DSP引擎從928-1968個。還有完整的片上網絡,包括兩個以太網接口,一個USB 2.0,兩個UART,兩個SPI,兩個I2C,兩個特別為汽車行業考慮的CAN-FD。LUT方面最高接近200萬個,Xilinx說足以媲美服務器級CPU。


L4無人駕駛瓶頸之一:計算平臺


Xilinx Versal AICore參數見上表,這麼牛掰的東西使用的晶體管數量驚人,Versal AI Core的旗艦VC1902使用了370億個晶體管,預計最低級的VC1352也有50億個。而英偉達的Tesla V100才212億個,Xavier才90億個晶體管。上個月英特爾還有更瘋狂的Stratix 10 GX 10M FPGA。這是全球密度最高的 FPGA,擁有 1020 萬個邏輯單元,433 億顆晶體管。通常芯片的晶體管密度是25-31百萬/平方毫米,Xilinx Versal AI Core最小都有大約250平方毫米的裸晶面積,這就註定其價格非常高昂。現在7納米的產能非常緊俏,FPGA的裸晶面積又特別大,但量又很低,筆者估計最低價格也是1500美金起。ACAP主要市場還是數據中心領域、5G基站和航天航空雷達領域。不過在汽車領域可以只用一片,甚至可以連風扇都不需要的小盒子搞掂L4運算平臺。


L4無人駕駛瓶頸之一:計算平臺

Versal ACAP在今年9月份正式推出,目前價格還未知。ACAP的出現或許表明初創公司做AI芯片不是個好方向,先不要說7納米一次流片費用近3億(28納米的芯片晶體管密度根本無法和7納米比)。即便是ASIC,一味強調算力,也根本無法和FPGA匹敵的。靈活度就更不用說了。初創公司還是做算法比較合適,等壯大了,才能燒錢做芯片。




【近期文章】

佐思汽研2020年多用戶報告撰寫計劃表

《周彥武研究特輯:智能駕駛硬件指南》


「佐思研究年報及季報」

主機廠自動駕駛策略研究 | 汽車視覺產業研究 | 低速自動駕駛產業研究 | 商用車自動駕駛產業研究 | 新興造車企業佈局及智能網聯功能對比分析 | 汽車MLCC研究報告 | 汽車分時租賃研究報告 | 5G自動駕駛專題研究 | 汽車仿真研究 | 高精度地圖產業研究 | 域控制器研究 | 自動泊車與自主泊車研究 | 激光雷達研究 | 毫米波雷達研究 | 處理器和計算機芯片研究 | 紅外技術及在夜視和DMS研究 | 中國毫米波雷達市場分析 | 汽車功率半導體研究 | HUD行業研究與供應商競爭力分析報告 | ADAS與自動駕駛Tier1研究 | 商用車自動駕駛研究 | 乘用車攝像頭季報 | 自主車廠車聯網產品分析 | T-Box市場研究報告 | 汽車網關產業研究 | 乘用車攝像頭季報Q2 | 豐田汽車新四化佈局 | 寶馬集團新四化佈局和戰略研究 | 全球及中國車載語音行業 | 中國及全球汽車線束、連接器與線纜研究 | 戴姆勒新四化佈局和戰略研究 | 日產新四化研究 | 本田新四化研究 | 吉利新四化研究 | 大眾集團新四化佈局和戰略研究


「佐思研究月報」

車聯網月報 | ADAS/智能汽車月報 | 汽車座艙電子月報 | 汽車視覺和汽車雷達月報 | 電池、電機、電控月報

聯繫人: 廖棪 13718845418(同微信) 卞亞娟 18600021096(同微信)


分享到:


相關文章: