05.21 英偉達教機器人向人類學習,只看一遍就能成功模擬!

英偉達西雅圖研究團隊開發了一套新系統,可以通過觀察一個人的行為來教機器人執行新任務,機器人只需
觀看一次便可成功模擬人類的簡單行為,讓機器人在充滿人類的地方工作,甚至可以向人類學習。

英偉達教機器人向人類學習,只看一遍就能成功模擬!

工業機器人通常總是一遍又一遍地重複已經編程好的的任務,通常情況下,機器人與編寫程序的工程師之間存在距離。然而,越來越多的研究人員開始思考如何讓機器人在充滿人類的地方工作,甚至可以向人類學習

在某種程度上,這正是Nvidia在西雅圖的新機器人實驗室所關注的,該公司的研究團隊今天在澳大利亞的機器人與自動化國際會議(ICRA)上,展示了機器人如何向人類學習的試驗,以及其最近關於機器人教學的工作。

正如英偉達的機器人技術研究高級總監Dieter Fox(也是華盛頓大學教授)所言,該團隊希望能讓下一代機器人安全地在接近人類的地方工作,但要做到這一點,這些機器人需要能夠探測到人,追蹤他們的活動,並學習人類如何幫助他人,這可能是在小規模的工業環境中或者在某人的家裡實現。

英偉達教機器人向人類學習,只看一遍就能成功模擬!

英偉達機器人高級總監Dieter Fox

雖然有可能訓練一種通過機械重複來玩電子遊戲的算法,並能教會它從錯誤中學習,但Fox認為,這種訓練機器人的方式可能會因為機器人要做決策的內容太多而無法有效地完成。相反,由Stan Birchfield和Jonathan Tremblay領導的英偉達研究團隊開發了一套新系統,可以通過簡單觀察一個人的行為來教機器人執行新任務

實驗中的任務非常簡單,只需將幾個彩色的方塊堆起來就可以,但這也是讓人類快速教授機器人新任務過程中的重要一步。

英偉達教機器人向人類學習,只看一遍就能成功模擬!

研究人員首先訓練了一系列神經網絡來檢測積木,並推斷積木之間的關係,然後生成一個程序來重複它所觀察到的人類堆積木的過程。研究人員說,這個新系統使機器人觀看現實世界中的一次演示,便能完成堆積木任務

該系統的一個優點是,它生成一個可讀的關於它所執行步驟的描述,以便讓研究人員更容易地弄清楚錯誤發生的具體情況。

英偉達公司的Stan Birchfieldt稱,該團隊的目標是讓非專業人員對機器人進行訓練變得容易,而且很少有任務比實驗中展示的堆積木任務更簡單。

在該實驗中,正如英偉達團隊在ICRA展示的那樣,有一臺攝影機負責觀看現場,人類只是走上前去,拿起積木並堆疊起來,然後讓機器人重複這個任務。這聽起來很簡單,但對於機器人來說,這是一項艱鉅的任務。

英偉達教機器人向人類學習,只看一遍就能成功模擬!

為了訓練核心模型,該團隊主要使用來自模擬環境的合成數據,正如Birchfield和Fox強調的那樣,正是這些模擬使得機器人能夠進行快速訓練,畢竟,在現實世界中進行訓練的時間要長得多,而且可能會更加危險。對於大多數的任務,都沒有現成的帶標籤的訓練數據。

“我們認為,使用模擬技術是一種強大的範例,它將訓練機器人完成以前不可能完成的事情,”Birchfield指出,Fox回應了這一觀點,並指出這種對模擬的需要是Nvidia認為其硬件和軟件最適合這種研究的原因之一。

畢竟,這個訓練過程有著非常強烈的視覺效果,而英偉達在圖形硬件方面的專業背景肯定會有所幫助。

Fox承認,還有很多研究要做(畢竟,大部分的模擬都不是實際情況),但至少這一理論的核心基礎已經到位。

英偉達教機器人向人類學習,只看一遍就能成功模擬!

未來,英偉達團隊計劃擴大機器人可以學習的任務範圍,以及描述這些任務所需的詞彙量。


分享到:


相關文章: