冰箱取物、製作蘋果派,美國萊斯大學博士讓機器人學習潛在動作

冰箱取物、製作蘋果派,美國萊斯大學博士讓機器人學習潛在動作

導讀

Affordance理論在21世紀初被引入到發育機器人領域,被描述為“潛在動作”。潛在動作建立了機器人和環境之間可能的動作關聯,它由當前任務、機器人自身的能力和環境的本質屬性共同決定。機器人的感知目標不再是物體的顏色、形狀等特徵,而是“可抓取、可推動”等動作屬性。潛在動作研究的重點是學習機器人和環境之間可能的動作關聯,應用它們來完成不同的任務,並且在執行任務的過程中不斷提升機器人的感知、行為和學習等能力。

讓我們先來看一段美國萊斯大學Dylan Losey博士近日在youtobu上發佈的對於最新研究成果,利用學習潛在動作輔助控制機器人的介紹視頻:

https://v.qq.com/x/page/w3022rrltnn.html


對於世界上將近十億的肢體殘疾的人來說,咬一口食物或倒一杯水是一個巨大的挑戰。輔助控制機器人(如安裝在輪椅上的機器人手臂)有望解決此問題。用戶通過與操縱桿互動來控制這些機器人,引導機器人手臂完成日常任務,而無需依靠人工。不幸的是,使這些手臂有用的非常靈巧也使用戶難以控制它們。

美國萊斯大學Dylan Losey博士等人提出,通過學習直觀而有意義的控制映射,我們可以使輔助機器人更容易被人類控制,該映射將簡單的操縱桿運動轉化為複雜的機器人行為。

冰箱取物、製作蘋果派,美國萊斯大學博士讓機器人學習潛在動作

控制機械臂進行冰箱取物

用戶試圖控制他們的輔助機械臂抓一些食物。在此過程中,它具有許多自由度(DoF),並且用戶需要協調所有這些相互關聯的DoF來完成任務。在實踐中,由於從低維人類輸入到高維機器人動作的直觀映射,控制輔助機械臂可能非常困難的。並且通常人必須多次切換控制模式才能完成簡單的任務。Dylan Losey博士說:我們設想了一種輔助機器人可以訪問與任務相關的演示的環境,這些演示可以由看護者或者用戶提供,甚至可以收集在另一個機器人上,重要的是,這些演示向機器人展示了機器人在相關情況下應採取的高維度動作。

冰箱取物、製作蘋果派,美國萊斯大學博士讓機器人學習潛在動作

高維到達和倒入運動的運動學演示

一旦機器人可以訪問這些演示,它將學習低維嵌入,該嵌入可以在不同的演示行為之間進行插值,並使用戶可以沿著與任務相關的動作來引導手臂。這種嵌入捕獲了一組連續的行為,並允許用戶通過移動操縱桿來控制和插補這些機器人運動。受當今用戶在控制輔助機械臂時遇到的困難的啟發,Dylan Losey博士等人提出了一種直接從數據中學習遠程操作策略的方法。

高維機器人動作通常可以嵌入到直觀的,人為控制的低維潛在空間中,可以將潛在空間視為捕獲數據最重要方面的流形(例如,如果數據是矩陣,則潛在空間可能是該矩陣的前幾個特徵向量)。首先將直觀和人為控制的潛在空間必須滿足的屬性列表形式化,並評估不同的自動編碼器模型如何捕獲這些屬性。

冰箱取物、製作蘋果派,美國萊斯大學博士讓機器人學習潛在動作

自我監督的方式學習非線性低維嵌入

最後,Dylan Losey博士在機械臂上進行了兩個用戶的研究,來比較我們的潛在動作方法與最新的共享自治基線和直接末端執行器遙控操作。參與者在利用我們的潛在動作時可以更快,更高效地完成輔助餵養和烹飪任務,並且還說,潛在動作使任務更易於執行。


任務一:用戶控制機器人拿起一個雞蛋容器,將雞蛋放入碗中,然後將該容器放回架子,直接遙控操作花費99秒,而潛在動作方法只需44s。

冰箱取物、製作蘋果派,美國萊斯大學博士讓機器人學習潛在動作

添加雞蛋任務

任務二:用戶使機器人拿起一個裝麵粉容器,將一些麵粉倒入碗中,然後將麵粉容器放回架子,直接遙控操作花費253秒,而潛在動作方法花費45s。

冰箱取物、製作蘋果派,美國萊斯大學博士讓機器人學習潛在動作

添加麵粉任務

任務三:用戶指導機器人拿起蘋果,將其放入碗中,然後攪拌混合物。你可以注意到的是,在直接遙控下,蘋果處在機器人工作空間的極限處,從而不得不尋找其他方向來抓蘋果,而潛在動作方法則可以一次性進行抓取,直接遙控操作花費140秒,而潛在動作方法只需61s。

冰箱取物、製作蘋果派,美國萊斯大學博士讓機器人學習潛在動作

添加蘋果任務

在整個製作蘋果派的任務中利用潛在動作的方法只需花費2分鐘是直接遙控方法的三倍多,大大提高了其輔助效率,並且極大情況下減小了控制難度,使用戶更輕鬆地控制輔助機械臂,總體而言,這項工作是邁向可與人類用戶無縫協作並瞭解其人類用戶的輔助機器人的一大步。


分享到:


相關文章: