來,讓你的車20分鐘學會自動駕駛

這段視頻中,Wayve明確表示他們將通過這個實驗去證明加強學習的算法是可以教會一輛汽車如何自動駕駛的。

來,讓你的車20分鐘學會自動駕駛

這輛通過改造的雷諾小車在行駛中的控制邏輯根據隨機的參數進行了初始化。在訓練階段,試驗車顯然一開始是處於一種隨機嘗試的狀態,一旦算法出現了錯誤的判斷,安全駕駛員將會介入終止它的操作並幫助車輛從正確的動作重新開始,而算法在出現錯誤並被終止之前的行駛行為將得到嘉獎,這顯然是為了讓算法能夠得到足夠的信息去判斷自己的行為是否正確。

來,讓你的車20分鐘學會自動駕駛

每一次安全駕駛員對於車輛的重新設置都是對於控制邏輯的一種優化,也是對算法的一種進階推動,而所有的優化都是在車上完成,並沒有單獨再進行脫機的計算和優化。

來,讓你的車20分鐘學會自動駕駛

通過視頻我們可以看到,經過四個小訓練週期之後,Wayve開啟了對試驗車的第一個評估測試。從結果來看,經過四個小訓練週期顯然還不足以讓系統勝任自動駕駛的任務,第一次評估測試僅僅安全行駛了9.8米。

來,讓你的車20分鐘學會自動駕駛

重複了另外兩個小訓練週期之後,開始了第二次評估測試,這一次系統算法的表現有所進步,畢竟已經經過了六個訓練週期。從表現來看,系統有了一定的糾錯能力,但是表現依然不夠穩定。這套系統的運行基於一套深度卷積神經網絡,它接受的輸入信號來自於單目攝像頭攝取的圖片,而系統的輸出則體現為對於方向和速度的控制。第二次評估測試的安全行駛距離達到了53.8米,比之於第一次顯然有了極大的提高。

來,讓你的車20分鐘學會自動駕駛

又經過了四輪小訓練週期之後,駕駛員開啟了第三次評估測試。最終,經過十一輪的訓練,這套車載系統掌握瞭如何在這條車道上自動循跡駕駛併成功地行駛完了整條道路。

來,讓你的車20分鐘學會自動駕駛

為驗證實驗結果,Wayve在不同的天氣條件下重複了多次這個實驗,這輛測試車也是第一輛由強化學習方法駕駛的車輛。這個實驗某種程度上也證明了強化學習即使在缺乏程序和地圖加持的情況下,也可以使車輛學會如何自動駕駛,而Wayve下一步將會推進這項技術儘快規模化以使其能夠適應更為複雜的駕駛任務。


分享到:


相關文章: