用VSLAM技術讓機器看懂世界

【文/虞超】SLAM(同步定位與地圖構建),是運動物體根據傳感器的信息,一邊計算自身位置,一邊構建環境地圖的過程,解決機器人等在未知環境下運動時的定位與地圖構建問題。主要應用於機器人、無人機、無人駕駛、AR、VR等領域。

按傳感器來分,SLAM主要分為激光SLAM和VSLAM兩大類。隨著計算機視覺的迅速發展,視覺SLAM因為信息量大,適用範圍廣等優點受到廣泛關注。

不久前,一款專為機器人應用領域開發的VSLAM整體解決方案——Project Explorer問世。該平臺利用現有的、基於魚眼雙目攝像頭的VSLAM追蹤解決方案,將RGB攝像頭、深度攝像頭和其他機器人相關的感應單元集成在一起,通過詮視科技的SDK接口,用戶可以快速構建自己的產品。而高工機器人網也有幸接觸到這款產品的背後主導者——詮視科技CEO林瓊。

■追尋“看世界”的夢

林瓊畢業於清華大學及美國南加州大學,從事圖像傳感技術15年,曾效力於東芝,APTINA,安森美等著名圖像傳感器公司。在過去的15年中,他始終帶著“把世界看美”的追求,用傳感器看世界。近些年林瓊發現,圖像傳感器正在發生著轉變,“把世界看美”已經不算是挑戰了,怎樣用視覺技術“把世界看懂”成為新的挑戰。在這樣一種大的行業轉變過程中,林瓊看到了行業發展的新方向,加之自己多年的資源儲備與人脈積累,他決定在接下來的15年裡,讓圖像傳感器“把世界看懂。”

用VSLAM技术让机器看懂世界

詮視科技CEO林瓊

“通過攝像機看世界,理解世界,看懂世界,包括我們做的環境感知,就是通過看世界來獲知你的位置和姿態。位置和姿態實際上在很多應用領域當中都是被關注的焦點。”林瓊說,“看懂世界”包括對物體的識別,以及對環境的認知,這兩者都必須基於視覺技術來實現。“我的工作經歷中包含了計算機視覺的技術背景,怎樣讓計算機視覺在今後的15年裡為人類服務,是我和我的團隊想要解決的問題。”

據林瓊介紹,他和他的同伴們都在計算機視覺領域深耕超過十餘年。“大家有共同的夢想,這是一個追夢的過程,所以我們的團隊叫‘夢之隊’。”林瓊笑著說。在當前階段,國內的市場環境也在發生改變,對智能製造、機器人、AR/VR/MR等技術的需求也越來越大,“而我們恰巧能夠服務於這些需求,因此大家辭去了高管的職務,置身於創業大潮中。”

公司最初創立於美國硅谷,去年在風險投資機構的支持下落地上海“在全球,我們的團隊共計27人,在美國、歐洲和國內均有研發團隊與技術支持,而且在過去的半年當中我們也通過了在AR/VR以及機器人領域的市場驗證,與多家知名企業進入design in階段,贏得了客戶的信任。”

■用VSLAM看懂世界

為了把世界看懂,就必須解析這個世界,而VSLAM恰巧是其中的一個核心技術。此前VSLAM始終沒能迎來爆發,很重要的一個原因是這種技術需要龐大的算力來支撐,而將這項技術進行高性價比的產品化是一個極具挑戰性的難題。“很幸運的是我們在一年多以前和Intel進行了合作,Intel的高速視覺處理器VPU能夠承載我們所需要的高速算法,而且體積輕巧,性價比高。”

用VSLAM技术让机器看懂世界

“計算視覺是個快速成長的領域”林瓊說,在過去的15年他看到過很多視覺算法的應用,在視覺計算中,VSLAM難度高,挑戰大,需要硬件與軟件的緊密結合,同時這又是一項單元技術,可以直接適用於很多領域,例如AR、VR、機器人和智能物流倉儲等。

“傳統的SLAM主要藉助激光來實現,而VSLAM技術在空間定位與姿態追蹤上可以用十分之一甚至更低的成本來實現同樣的效果。但VSLAM有特定的使用條件——自然光與特徵點,因此在一些特定的環境下,我們需要引入主動光來配合解決一些特定環境下帶來的識別問題。”林瓊表示,和傳統的SLAM相比,VSLAM的優勢在於使用了視覺算法,可以提取空間屬性,而傳統的激光雷達則不具備這種能力。“因此我們在定位的同時,還能將環境的感知和認知結合起來,對於空間尺度、障礙物的判斷是非常準確的。”

詮視科技最新的針對機器人領域的整體解決方案Project Explorer,已能夠準確探知自己所處的位置,同時清楚判斷周圍的環境。最獨特的一點是,這些功能都可以在一個小小的模組內本地化解決。“本地化數據處理可以幫助機器人不再依賴於主機,小小的模組可以直接輸出其在所處三維空間中的6DOF座標數據,甚至識別周邊物體的屬性,而將這樣一款產品小型化集成化,也是我們創始人團隊多年的夢想。”據林瓊介紹,這款產品的整體功耗極低,不超過1.8瓦。

用VSLAM技术让机器看懂世界

ProjectExplore擁有小巧的體積

在確定了超高速、低功耗、高精度以及高性價比這一目標後,林瓊和他的團隊用了一年時間,打造出了這款產品,目前除AR、VR外,已能應用於工業機器人、無人機、AGV、遊戲、3D重建等領域。

■VSLAM處在應用爆發的前夜

“VSLAM是一個學術界研究了很久的領域,有很多開源的東西。開源的好處在於給研究者提供了基本的平臺,但如果需要進行超小型產品化,那還是需要有核心的技術。而開源想要實現這些目標,則必須花大量的時間去移植平臺。”林瓊表示,自己的團隊在行業內的領先之處則在於,全部的核心算法和核心硬件、實施,核心的工藝製造流程都是自主研發,因此在產品的速度、精度、適應性以及魯棒性都非常好。

用VSLAM技术让机器看懂世界

VSLAM應用處於爆發的前夜,未來在室內定位、追蹤等場景均可以使用,由於體積小巧且具有很高的性價比,該技術可以解決很多傳統激光傳感器無法解決的問題。林瓊強調,如果再將一些小概率場景問題解決好,VSLAM甚至有可能全面替代激光。特別是在機器人領域和AR設備中,基於雙目的VSLAM設備將成為不可或缺的存在。

“機器視覺對計算的要求很高,特別是對計算平臺的要求,因此我們選擇與Intel進行合作。”林瓊說:“我們已經看見黎明的曙光。如果接下來的幾年中,半導體的成本,功耗還能進一步的下降,那麼各種應用將會鋪天蓋地的出現。”

“VSLAM當前也面臨著一些挑戰,例如弱光環境,以及一些其他的小概率事件,雖然這些情況在激光傳感器上也同樣存在,但後者已經在產業中經歷過驗證,而VSLAM恰恰還處於驗證的過程當中。”


分享到:


相關文章: