為什麼說光靠模擬玩不轉自動駕駛?

作者 / 葉方

出品 / 汽車之心(微信 ID:Auto-Bit)

自動駕駛汽車依然面臨一個尷尬的問題:

號稱自動駕駛,這些汽車到底什麼時候不用人類駕駛?

這個問題的最終解釋權在道路交通管理部門。

放下各種法律法規不談,汽車和科技巨頭們在技術端依然沒能實現全自動駕駛。

因此,除了在公路上持續測試,自動駕駛公司還求助於模擬,試圖在虛擬環境中試遍各種情況,將現實世界中不常出現的變量也一一化解。

通常來說,我們通過考試,就能拿到駕照通行全國。但換到自動駕駛汽車上,這一套就行不通了。

這些車輛的獲得相關能力時需要「因城施策」,而且必須進行更為詳盡的場景測試,甚至精確到某個十字路口。

為了進入這個價值 7 萬億美元的超級市場,業內各家公司在測試上卯足力氣,以便贏得公眾和監管者的信任,而模擬測試顯然是他們證明自己的最佳展示平臺。

汽車之心(微信 ID:Auto-bit)以模擬為切入點,整理總結了來自包括汽車廠商、科技巨頭、新創企業在內的公司專家的觀點。

這些業內頂級的專家正花費鉅額資金回答一個問題,即我們到底該測試些什麼?

為什麼說光靠模擬玩不轉自動駕駛?

圖 1:模擬與現實中的十字路口

1、沒有模擬,就沒有自動駕駛汽車

拿通用自動駕駛團隊 Cruise 來說,Cruise 的虛擬測試車每天要在模擬器中運行 20 萬個小時。

至於公認的行業領頭羊 Waymo,在模擬器裡已經累積了超過 100 億英里的測試里程。

為什麼說光靠模擬玩不轉自動駕駛?

自動駕駛汽車在模擬場景中訓練圖片來自51VR自動駕駛仿真平臺

對自動駕駛公司來說,尤其是訓練神經網絡時,模擬器的重要性越來越強了。

為什麼放著現實世界的數據不用而求助於模擬?原因有三:

1. 在現實世界採集數據是有危險的;

實車測試無法滿足自動駕駛的測試里程要求和場景覆蓋度要求。模擬是保障自動駕駛汽車安全不可或缺的測試手段。

行業內專家學者認為,驗證自動駕駛汽車的安全性需經過上億公里的測試里程積累,如蘭德公司認為自動駕駛需要幾億公里的里程測試數據來確保安全性,寶馬認為自動駕駛研發至少需要達到 2.5 億公里的測試。

2. 許多假設和反事實情況在現實中是無法企及的;

與實車測試相比,仿真模擬測試可以在短時間內對罕見案例進行多次復現,加速自動駕駛汽車的生產週期,節約研發成本,積累測試里程。

3. 採集更為豐富數據的要求。

這是因為現實世界中數據採集的速度有限。

可以這麼說,現在沒有哪家自動駕駛公司不用模擬器。

對測試軟件來說,模擬器是絕對的殺手級工具,在某些情況下它還能訓練神經網絡。

為什麼說光靠模擬玩不轉自動駕駛?

自動駕駛技術不過關,後果可能是車毀人亡

那麼,這些公司是如何利用自動駕駛模擬測試反哺到真實的場景中去的?

與 Waymo 類似,Zoox 也有「無保護左轉困難」的煩惱。

於是,Zoox 團隊開發了一個人工左轉信號燈,然後灌入模擬環境。

Zoox 聯合創始人 Jesse Levinson 透露稱,不久之後 Zoox 的自動駕駛系統識別起現實世界的左轉信號燈就順暢多了。

今年早些時候,Lyft 注意到自己的測試車一旦被其他車加塞,就會急剎車。

於是,Lyft 的工程師將這一場景放入模擬器。據 Lyft 自動駕駛負責人 Luc Vincent 介紹,這樣的方法不但速度快,成本低,自動駕駛系統「一驚一乍」的毛病也得到了改善。

Aurora 也非常依賴模擬,通過記錄人類駕駛員的駕駛習慣,然後在模擬器中與自動駕駛系統進行對比。

Aurora 聯合創始人 Sterling Anderson 說,在路測前會專門提醒司機,必須像專業司機那樣去駕駛。

與其他公司一樣,特斯拉也不敢輕視模擬器。特斯拉 CEO Elon Musk 表示,「世界太複雜,說不清什麼時候就會有極端情況登門造訪。」

好消息是,模擬器裡場景幾乎是無限的。但大多數公司並不願透露自己到底測試了多少場景。

安波福是個特例,據汽車之心瞭解,安波福已經在模擬器中構建了超過 4 萬個場景。

有行業人士表示,想要實現 100% 的完美是不可能的。但在讓自動駕駛系統更安全的過程中,我們得保證一切安全可靠。

2、模擬也有短板

既然自動駕駛模擬測試可以反哺到真實場景中去,那麼模擬能替代現實世界中大規模的數據採集工作嗎?

答案是:不能。

原因在於,模擬無法擁有與現實世界相同的經驗知識,而其中一些經驗知識對駕駛來說又必不可少。

舉例來說,模擬器中沒有其他道路參與者如:車輛、行人與自行車等行為習慣的經驗知識。

這個問題可以分為兩部分:

  • 行為預測:在道路參與者做出下一步動作前預知他們的行為。
  • 溝通與互動:瞭解道路參與者對自動駕駛汽車的行為會作何反應,同時知曉該如何做出相應反應,以實現雙贏的結果。


人類的行為表現是一個經驗問題,需要經驗數據來解答。

也就是說,類似遊戲中那樣簡單化的人類行為模型,對付一些有限的駕駛環境還行,但隨著場景變得更密集,城市擁擠、混亂、複雜、交互等一系列條件疊加時,為人類行為建模的難度會幾何級增長,簡化模型的預測能力也會直線下降。

而自動駕駛汽車需要精確的經驗現象模型。

舉例來說,如果一輛自動駕駛汽車在路口左轉,面對迎面駛來的車輛,它必須判斷到底對方會不會減速?減多少速?

這類知識從紙上談兵般的分析中得不出來,這完全是經驗。

這也是為什麼馭勢科技的一位工程師向汽車之心(微信:Auto-bit)解釋:

模擬的技術難點之一在於「真」。如果做得不夠逼真、不夠貼近現實,那麼依託於模擬之上的自動駕駛系統開發也會變得失真,最終無法應用於現實世界。

為什麼說光靠模擬玩不轉自動駕駛?

作為「不差數據」的頭部公司,Waymo 選擇用手上積累的測試數據訓練人工智能系統,以更好地模仿真實司機與行人。

在模擬測試中,Waymo 甚至會測試模擬的人類駕駛員與行人是否會撞向對方,以此來判斷模擬的場景是否足夠真實。

Waymo 首席科學家 Drago Anguelov 解釋,這個領域其實才剛剛萌芽。如果你見的模擬器多了,就會發現它們中許多模擬出的世界並不真實,因而會影響測試效果。

就拿 Uber 來說,最近 Uber 在測試停著的車後站人的場景,結果顯示模擬器中的車根本不會像現實中一樣減速。

工程師對模擬器精度進行校準時發現,原來車輛只注意到了前方交通信號燈的顏色。綠燈亮起,車輛自然會加速行駛。

Uber 趕緊對這一問題進行了調整,以保證車輛表現得像現實世界中一樣(靠近紅綠燈才開始識別)。

3、採集現實世界的數據

訓練行為預測的數據可以被動地從現實世界中採集,只要車輛配好攝像頭、計算機和互聯網就行。此後,觀察、預測、標記錯誤並上傳等就可以完成。

訓練溝通與互動的數據也能被動採集,只要我們記錄下駕駛員駕駛時的輸入,如轉向、加速、剎車和燈光信號等。

在業內,我們稱之為模仿學習。

人類駕駛員會手把手向神經網絡展示如何與現實世界的道路參與者進行溝通與互動,而神經網絡只需要在情境變量相同時執行此前學到的動作即可。

從理論上來講,這些有用的數據我們也可主動進行採集。

例如,自動駕駛汽車或駕駛員輔助系統做出某一判斷後,如果人類駕駛員給予否定(接管方向盤),那麼這次糾正就會成為模仿學習的重要材料。

當然,如果換到強化學習的語境下,系統就能在不斷減少人類干預的情況下等到獎勵。

如果哪家自動駕駛公司能讓神經網絡精確模仿人類駕駛員的行為,在模擬時就能精確很多。

完成這一步後,他們就能利用模擬的方法訓練神經網絡如何進行駕駛強化學習模式。

不過想要實現這一目標,還是得先從現實世界採集海量數據。

4、模擬器裡並沒有駕駛的真知灼見

想學會駕駛,自動駕駛汽車需要準確預測其他道路參與者的一舉一動,同時還能與他們進行溝通和互動,特別是其他車上的人類駕駛員。

想做好預測工作,就得從經驗出發觀察其他道路參與者,而成功的溝通與互動則需要對其他道路參與者的一舉一動了如指掌,這同樣需要經驗。

所以說,模擬器裡並沒有駕駛的真知灼見,除非它是由經驗數據訓練出來的神經網絡。

想向模仿學習與強化學習借力,自動駕駛汽車可能得在路上行駛上百年,因為系統對經驗的需求量實在太過龐大,一個幾百輛車的測試車隊只能算杯水車薪。

當然,即使自動駕駛公司手上有數百萬輛新車,也不一定能完美實現全自動駕駛,但它們帶來的數據肯定可靠性要強得多。


分享到:


相關文章: