如何打造自動駕駛計算中樞?地平線車規級AI處理器背後的「祕密」|2018 全球智能駕駛峯會

如何打造自动驾驶计算中枢?地平线车规级AI处理器背后的“秘密”|2018 全球智能驾驶峰会

*地平線(上海)芯片研發總經理吳徵

雷鋒網新智駕按:10 月 26 日至 27 日,2018 全球智能駕駛峰會在蘇州召開,本次峰會由蘇州市相城區人民政府主辦,蘇州高鐵新城管理委員會、雷鋒網新智駕和數域承辦,邀請到來自主機廠、科技公司、資本機構和產業研究機構等領域的多位專家,共同打造了一場智能汽車和自動駕駛領域的頂級峰會。

本次峰會上,地平線(上海)芯片研發總經理吳徵發表了題為《車規級AI處理器—打造自動駕駛計算中樞》的主題演講。吳徵博士曾在三星半導體、矽瑪特、飛思卡爾和摩托羅拉等多家跨國公司擔任中國區高管職位。吳徵博士從事芯片/半導體行業超過二十年,近期加入地平線,負責研發自動駕駛的AI車規級處理器。這也是吳徵博士加入地平線以來的第一次公開演講。以下為吳徵演講全文,雷鋒網(公眾號:雷鋒網)新智駕進行了不改變原意的編輯(略有刪減):

地平線是一傢什麼樣的公司?

如今我們已進入一個大數據時代,無論是人們在淘寶、京東網上購物,或使用手機上網、拍照,或在市區裡開車“一不小心”被拍......生活中無時無刻不在產生大量的數據。日積月累的數據量非常龐大,但多數情況下,眾多貌似是重複性的、無用的數據被擱置在旁,真正使用時又非常困難。

如何將大量的無用數據轉化成有用數據,挖掘其背後的價值?這是一個很大的挑戰。這涉及到如何有效地進行數據處理,本質上看,這是一大計算問題。

AI作為一種的關鍵技術,它基於大數據進行訓練和推理,可將無用數據進行“識別”, 把非結構化數據轉化成結構化數據,提取有用的信息。首先,我們來回顧一下近幾年AI計算芯片的發展:

  • 英特爾的CPU傳統架構,在處理大量數據方面顯得效率不高,算力不足;

  • 後來,英偉達的GPU被應用,其計算能力強,性能強大,但也有侷限性,比如功耗高,成本貴;

  • 最近幾年,FPGA盛行,其架構適合CNN計算,能耗比高,現場可編程適合各種場景,但對一般開發者來說,其開發較難;當大規模量產時,成本、功耗也比較高。

最近幾年,一些平臺公司,例如Google,本質上是一家軟件互聯網公司,亦開始擁抱硬件,甚至進軍芯片。很重要的一點是,龐大的數據量需要有效處理。目前越來越多的公司開始考慮軟硬件融合,打造生態圈。

作為一家技術驅動型的公司,有著強大人工智能算法的地平線,自成立即定位於一家軟硬件結合的公司, 其核心是要打造自己的BPU (Brain Processing Unit)芯片,類似於 Google 的TPU。地平線瞄準的是嵌入式AI 芯片,應用在物聯網方面的終端產品,節點和控制設備, 專注於邊緣計算。這與研發服務器,雲端AI芯片不同, 前者計算性能更強大,同時功耗和成本也是需要考慮的問題。

AI計算技術與應用場景高度相關。以人臉識別和自動駕駛環境識別為例,其訓練、推理及算法不同。 在一定程度上可以理解為:場景決定算法,算法決定芯片。反之,芯片又要求有算法,只有軟硬件接合,提供解決方案應用到場景才能最終解決問題,這是一個閉環系統。

2015年成立之初,地平線確定專攻AI嵌入式芯片,當年9月開始研發BPU;這期間地平線也在發力FPGA,同英特爾合作開發ADAS系統;去年6月,地平第一代AI芯片(BPU)流片,並在去年年底發佈了第一代AI芯片“征程”和“旭日”。地平線BPU架構正在不斷完善,性能更強,於今年初發布基於BPU第二代架構的Matrix視覺感知方案,並在CES上進行公開實車Road Show。今年地平線兩款芯片已經開始量產。

今年底,地平線將完成新一輪融資,金額為5-10億美元,投資方包括一家和英特爾規模相當的芯片公司,以及一家知名汽車廠商。

以BPU為核心,地平線提供的是一整套軟硬件綜合解決方案,包括芯片,算法,編譯器和運行時庫,以及訓練仿真的綜合平臺。業務覆蓋三大領域:智能駕駛、智慧城市、智慧零售。

車規級AI處理器

算力是智能駕駛芯片的核心問題,地平線專注於視覺感知領域。

車規級AI處理器的研發目前面臨幾大挑戰:強大的計算能力,可靠性,功能安全,和質量管理與長週期的支持體系。

目前一輛汽車大多裝載多個攝像頭,每個攝像頭或720P,或1080P,每秒30幀。未來車身上會有越來越多的攝像頭,6個、8個甚至12個,逐漸升級的分辨率,為自動駕駛帶來的是巨大的數據處理量。另外一方面,基於神經元網路的AI計算量也是巨大的。

就目前看來,面向L2、L3級自動駕駛處理器的算力要求達到數十個TOPS,L4到L5級將達到數百,甚至千TOPS級的要求。

不同於用在一般消費產品方面的芯片,用於汽車方面的半導體面臨的環境更嚴苛,對可靠性要求高。感知決策關係著汽車與人身安全,所以對功能安全要求更高。

一款芯片從芯片定義,設計,流片,測試和驗證,到獲得車規級認證需要花費很長的時間。另一方面,汽車芯片進入供應商或主機廠,從導入設計到設計採納,一輪輪測試與驗證,一款芯片與OEM磨合成功,並實現真正量產至少需要3-5年。這是一筆很大的投入。而且,汽車上的MCU、信息娛樂等芯片目前並沒有中國品牌的身影,可見應用到汽車方面的半導體芯片的門檻非常高。

應用於汽車方面的芯片或車規級芯片與消費級芯片不同,可從以下幾個維度進行對比:

  • 溫度方面:消費級芯片使用溫度一般在0°—70°;工業級半導體使用溫度更寬一點;在汽車上,溫度需要低至-40°,高溫要到105度到125°;

  • 從使用週期來看:消費型半導體為1—3年,而一輛汽車的壽命至少為10—15年;

  • 從現場失效率來說,消費等級的是小於10%, 而汽車芯片的目標要求為零失效率。

值得一提的是,汽車半導體需要通過AEC-Q100認證。在質量認證方面,除零失效率,汽車半導體產商還需經過TS16949質量管理認證和10年以上的支撐體系。

另外,和安全相關的芯片應用到汽車上,需經過功能安全認證,來保證安全護航。這是值得重視的一點。

為什麼功能安全認證如此關鍵?

和手機相同,電子信息化比重越來越大的汽車可以看作為是一個複雜的嵌入系統,無法做到盡善盡美,失效是不可避免的,一般分為兩種情況:

  • 系統失效,或因產品的系統規格不完善,或因硬件芯片設計或軟件開發中的“錯誤”;

  • 隨機失效,這或是個永久性錯誤,例如汽車的老化效應造成電路某處連接出現問題,或者是瞬態錯誤,例如某一瞬間的電干擾。所以參局者需要遵從業界最好規範來減少這些系統失效的風險,實施安全機制來減少隨機失效的風險。

功能安全對應汽車方面即ISO26262標準。這是一整套流程,即從需求,開發,驗證到認證,從IP,EDA工具到芯片設計,從硬件到軟件,系統均有規範,形成一套完整的功能安全體系。面向量產的芯片需經過認證達到一定ASIL等級,例如和ABS,EPS相關的芯片必須達到ASIL-D等級。

接下來,再看面向自動駕駛的AI處理器如何滿足強大算力的需求。

傳統的馮諾依曼架構已無法滿足深度學習的計算要求,地平線自主創新的BPU,是一種多指令多數據MIMD架構,其能夠滿足數據流的計算要求,實現靈活的數據分發和計算的併發異步處理,並對CNN計算中關鍵的乘加運算(MAC)單元達到很高的利用率,所以地平線BUP的每瓦TOPS性能相當突出。

地平線車規級AI處理器芯片的最新進程

地平線BPU於去年發佈的第一代高斯架構,到目前的第二代基於伯努利架構,均採用新型稀疏二值化神經網絡結構,可支持更多路視頻輸入,支持多傳感器融合,目前主要集中在感知領域,後期將進行定位,建模,預測,路徑規劃到最終決策。

地平線面向智能駕駛的BPU和Matrix視覺感知系統,已經向歐美汽車廠商交付。BPU 2.0可以實現多路攝像頭、多場景融合,能效更佳, 可在30W的功耗下實現基於像素級的圖像識別分割,可識別人、牌照、車型、交通紅綠燈、路標、障礙物等等。

地平線目前的第二代車規級AI芯片,已進入最後的開發階段。與第一代不同,前者從方框級的識別精確到像素級的語義識別。

總體來看,基於自動駕駛,地平線打造的是車規級AI處理器或SoC,提供相關的軟件算法,核心編譯器、運行時庫,訓練,工具鏈一整套的平臺和整體解決方案。

最後,以地平線量產的兩款芯片名字來結尾,用於智能IPC的旭日(Sunrise)和用於智能駕駛的征程(Journey)。在地平線看來,自動駕駛目前正在蓬勃發展階段,但未來的發展依舊面臨挑戰,無論是商業大規模落地還是技術實現方面。但這是一段美好的征程,我們將像AI的深度學習一樣,不斷的學習,不斷的進步,攀登一座又一座的高峰,最終達到幸福的彼岸。


分享到:


相關文章: