機器手,離哆啦 A 夢還有多遠|Nature 自然科研

本文由《Nature 自然科研》授權轉載,歡迎訪問關注。

原文作者:Richard Hodson

人類手指靈巧,但是機器人正在迎頭趕上。

在 1973 年的經典科幻電影《西部世界》中,度假勝地的機器人員工與人類客人沒有什麼區別,除了一個小線索:工程師們還沒有完善機器人的手。

現實機器人的能力遠遠落後於《西部世界》中的機器人殺手,但在這一小點上,現實和虛構是一致的:手和物體的操控,正是機器人技術中特別具有挑戰性的一部分。加州大學伯克利分校的工程師 Ken Goldberg 說:「抓握是目前(機器人技術)最重要的挑戰。」

机器手,离哆啦 A 梦还有多远|Nature 自然科研

在過去的 50 年裡,機器人在嚴格控制的工作條件下已經表現得非常好,例如在汽車裝配線上。昆士蘭科技大學澳大利亞機器人視覺中心(ACRV)的機器人研究員 Juxi Leitner 說:「你可以針對一項特定的任務建立一個機器人系統,比如撿起一個汽車零件。你確切知道要把某個部件放置到什麼位置,機械臂需要達到什麼位置;因為機器人已從同一個地方拾起同樣的部件幾百萬次了。」

但現實世界不是一條可預測的裝配線。儘管人類可以輕鬆地與工廠大門之外的無數物體和環境相互作用,但這對於機器人來說卻極其困難。

這些幾無章法可言的環境是機器人研究人員需要攻克的下一個前沿領域,它們對於機器人抓握來說是特別棘手的。任何希望與外界進行實體交互的機器人都不得不面對一個問題:物體對觸摸的反應具有內在不確定性。Goldberg 說:「預測遙遠的小行星的運動比我們預測一個簡單物體被推過桌子的運動要容易得多。」

一些研究人員正在使用機器學習來使機器人獨立識別和設計如何抓取物體。另外一些人則正在改進硬件——機械手從鉗形結構到仿人手,不一而足。機器人學家也正全力以赴應對如何操控抓握住的物體這一挑戰。

提升機器人抓握能力可能會產生巨大的社會影響。商業實體,特別是涉及各種貨物運輸的實體,正在密切關注著相關研究的發展。「這方面具有巨大的需求。伴隨著電子商務的飛速發展,產業界非常希望能解決這個問題。」Goldberg 說。業界的研究興趣比以往任何時候都大,「這是一個將研究真正付諸實踐的好機會。」

學會學習

過去三年來,電子商務巨頭亞馬遜組織的年度競賽充分體現了產業界對此的濃厚興趣。亞馬遜機器人挑戰賽(Amazon Robotics Challenge)要求參賽隊伍設計並製造一種機器人,讓它根據客戶訂單將物品從集裝箱中分揀出來,然後放進盒子內。

物品種類多樣,從瓶子、碗到軟玩具和海綿,皆包括在內;而且這些物品一開始是混雜在一起的,這使得物體辨別和機械抓握都非常具有難度。

2017 年 7 月,Leitner 的 ACRV 隊建造的機器人 Cartman 奪得了挑戰賽的勝利。Cartman 類似於遊樂場中的抓娃娃機,由一個鋁製框架支撐機械爪組件構成。它有兩個用於拾取物體的工具——末端執行器,

一個是兩塊平行板組成的抓器,另一個是連接了真空泵的吸盤

對於機器人遇到的每一個物體,研究人員都指定了應該首先嚐試哪一個執行器;如果不起作用,機器人就會切換另一個。

不過,機器人首先必須找到它所要尋找的物品。為此,ACRV 隊採用了機器學習方法。Cartman 主要依靠業內流行的 RGB-D 相機獲得輸入,RGB-D 相機可以同時獲取物體顏色和深度信息。相機通過執行器向下看,看到下面盒子的內部。

Leitner 解釋說,這個角度有利於 Cartman 標記每個像素對應的物品——這是一種被稱為語義分割的深度學習形式。一旦找到目標物品的像素群,相機的深度感應能力就可以幫助機器人計算出如何抓取該物品。Leitner 說:「簡單地說,我們把物品露在外面最多的那部分固定住。」

機器人抓取技術的最新進展得益於機器學習的快速發展。「軟件一直是制約瓶頸,但由於深度學習,它正變得越來越先進。」加州大學伯克利分校的深度學習專家 Pieter Abbeel 說。這些發展開啟了「機器人應用的全新途徑」。

Abbeel 是加利福尼亞埃默裡維爾的一家初創公司

covariant.ai 的聯合創始人和首席科學家,公司使用深度學習來訓練機器人。與其設定機器人執行特定的動作,倒不如通過人類示範教會機器人適應同一問題的不同場景。

人類教練通過頭戴裝置觀看機器人手臂上相機的反饋圖像,並使用運動控制來引導機器人手臂拾取物體。在此過程中所採用的方法數據會傳輸給神經網絡。「只要有幾百次這樣的演示,你就可以訓練一個深度神經網絡學會一項技能。」Abbeel 說,「我的意思是,機器人不是掌握了一種它將重複執行的特定動作,而是掌握了根據相機反饋來調整動作的能力。」

Goldberg 也同樣使用機器學習來訓練機器人掌握抓握技巧。但他不是從真實世界中收集數據,而是對他的 Dex-Net 軟件進行虛擬訓練。「我們可以迅速模擬出數以百萬計的抓握。」他說。該軟件使工業機器人能從成堆的物體中拾取指定物品,即使是它以前沒有見過的,且成功率超過 90%。應對某個特定物體時,它還可以自己決定是使用平行鉗夾還是吸盤工具。

第四代 Dex-Net 將於 2018 年面世。根據 Goldberg 和其他機器人學家開發的一種體現可重複性的度量指標——每小時平均分揀次數,Dex-Net 目前屬於最快的一類分揀機器人,每小時平均分揀次數可以達到 200 次以上,雖然仍然落後於人類——約為 400 到 600 次,但還是遠遠超過最近的亞馬遜機器人挑戰賽參賽團隊所取得的成績(見「成功的衡量標準」)。

机器手,离哆啦 A 梦还有多远|Nature 自然科研


分享到:


相關文章: