深度學習浪潮過後,計算機視覺將走向何方

如果問今年最火的人工智能研究領域是什麼?答案一定是三維視覺

在最近公佈的2018年計算機視覺國際頂級會議 CVPR論文錄用名單中,高達 83 篇以“3D”為名,涉及三維視覺的工作則超過 90 篇,佔據了全體收錄論文的近 1/10。

三維視覺(又稱立體視覺),是要讓計算機感知周圍的三維環境結構、物體的形狀,以及物體和物體之間的相對位置等,它是計算機視覺的經典研究領域。再度火熱,一方面歸功於三維傳感器的快速發展,另一方面也來自於智能移動機器人、無人駕駛、AR等三維應用場景快速發展衍生的強烈需求。

深度學習浪潮過後,計算機視覺將走向何方

2018年6月,在全球人工智能與機器人峰會上,國際計算機視覺與圖形學專家、香港科技大學權龍教授主題報告中提到,“當下因為深度學習技術的發展,計算機視覺變得異常火熱,而計算機視覺的下一個層次必將走向三維重建”。商湯科技CEO徐立在採訪中也表示:“SLAM和三維重建是當今智能視覺的前沿方向,是商湯高度關注和重視的領域”。

三維視覺的應用

近年來, 三維視覺技術開始從實驗室走向“尋常百姓家”,服務於人們的生活和娛樂。

首先最直接的應用是在機器人領域的應用。一個機器人要在環境中行走,首先要知道這個環境中的三維結構是什麼,所以要對周圍的環境進行三維重建,這就是地圖的重建;同時要知道它走在什麼地方,就需要進行定位。目前,基於視覺傳感器的機器人定位,也是最靈活、性價比最高的定位方式,相比於其他的傳感器,這是機器人能夠進入到千家萬戶的手段之一。

還有虛擬現實怎麼應用三維視覺的,比如虛擬現實對內容進行製作,要進行 360 度全方位的感受和觀察,就需要三維重建的技術。虛擬現實還有一個交互的屬性,你要基於動作的交互就可以使用相機或視覺的定位技術,如果定位技術精度越高,以及速度越快,虛擬現實的在場真實感越強。還有增強現實的應用,比如你拿相機或手機拍攝一系列周圍的真實場景的圖像,然後把這個圖像在顯示屏上或手機上顯示出來,要在這個畫面上插入一些虛擬的東西,使得虛實進行自然逼真的融合,這就需要三維視覺的重建和定位,把虛擬的物體放入到重建的場景中,根據定位的姿態和朝向把這個虛擬的物體與真實的畫面顯示出來,這也是三維視覺在增強現實裡的應用地方。

深度學習浪潮過後,計算機視覺將走向何方

在生活服務中,比如在精細導航,目前室外的 GPS導航不到某個樓的樓層,依靠視覺定位的技術就可以精細到某個樓層的導航。還有虛擬廣告,通過拍攝的照片、相機的位置,可以把虛擬的畫插入進去。還有自助旅遊,對一個旅遊景點進行三維重建,如果遊客在這個場景裡行走,走到哪可以拍攝一張照片,通過拍攝的照片計算出位置,就可以基於這個位置對你進行服務。

三維視覺的入門

近代三維視覺,是由三維重建定義的。為了幫助大家系統學習三維視覺的知識及相關技術,專注於人工智能在線教育的深藍學院,推出『基於圖像的三維建模』。課程注重理論與實踐相結合,針對關鍵的算法,講師會逐行代碼親自實現,而不會調用現成的函數庫。課程優秀學員可達到企業實習/就業的要求。

第1講. 特徵點的檢測與匹配

實踐項目: C++ 實現Sift 特徵檢測與匹配

第2講. 雙目立體視覺

實踐項目: C++實現基礎矩陣的優化與相機姿態參數的恢復

第3講. 從運動到結構Ⅰ

實踐項目:基於Ceres優化庫實現捆綁調整

第4講. 從運動到結構Ⅱ

實踐: C++實現增量運動恢復結構

第5講. 稠密重建

實踐:C++實現基於深度融合的稠密重建

第6講. 點雲到網格的重建

實踐: C++ 實現高斯隱函數重建與網格生成

實踐: C++ 實現網格的可視性計算與優化

實踐:C++實現紋理圖像的非線性顏色矯正

結語

三維視覺理論日趨成熟,逐漸走向應用,尤其在大數據和移動端具有廣泛的應用前景,但是對視覺來說,它存在根本性的問題,就是魯棒性和可靠性不是很高。有效的途徑是要進行多傳感器、幾何與學習結合,來解決這個魯棒性和可靠性的問題。

深度學習浪潮過後,計算機視覺將走向何方


分享到:


相關文章: