2018-08-09 16:19:48 深藍學院

如果問今年最火的人工智能研究領域是什麼？答案一定是三維視覺

。

在最近公佈的2018年計算機視覺國際頂級會議 CVPR論文錄用名單中，高達 83 篇以“3D”為名，涉及三維視覺的工作則超過 90 篇，佔據了全體收錄論文的近 1/10。

三維視覺（又稱立體視覺），是要讓計算機感知周圍的三維環境結構、物體的形狀，以及物體和物體之間的相對位置等，它是計算機視覺的經典研究領域。再度火熱，一方面歸功於三維傳感器的快速發展，另一方面也來自於智能移動機器人、無人駕駛、AR等三維應用場景快速發展衍生的強烈需求。

2018年6月，在全球人工智能與機器人峰會上，國際計算機視覺與圖形學專家、香港科技大學權龍教授主題報告中提到，“當下因為深度學習技術的發展，計算機視覺變得異常火熱，而計算機視覺的下一個層次必將走向三維重建”。商湯科技CEO徐立在採訪中也表示：“SLAM和三維重建是當今智能視覺的前沿方向，是商湯高度關注和重視的領域”。

三維視覺的應用

近年來，三維視覺技術開始從實驗室走向“尋常百姓家”，服務於人們的生活和娛樂。

首先最直接的應用是在機器人領域的應用。一個機器人要在環境中行走，首先要知道這個環境中的三維結構是什麼，所以要對周圍的環境進行三維重建，這就是地圖的重建；同時要知道它走在什麼地方，就需要進行定位。目前，基於視覺傳感器的機器人定位，也是最靈活、性價比最高的定位方式，相比於其他的傳感器，這是機器人能夠進入到千家萬戶的手段之一。

還有虛擬現實怎麼應用三維視覺的，比如虛擬現實對內容進行製作，要進行 360 度全方位的感受和觀察，就需要三維重建的技術。虛擬現實還有一個交互的屬性，你要基於動作的交互就可以使用相機或視覺的定位技術，如果定位技術精度越高，以及速度越快，虛擬現實的在場真實感越強。還有增強現實的應用，比如你拿相機或手機拍攝一系列周圍的真實場景的圖像，然後把這個圖像在顯示屏上或手機上顯示出來，要在這個畫面上插入一些虛擬的東西，使得虛實進行自然逼真的融合，這就需要三維視覺的重建和定位，把虛擬的物體放入到重建的場景中，根據定位的姿態和朝向把這個虛擬的物體與真實的畫面顯示出來，這也是三維視覺在增強現實裡的應用地方。

在生活服務中，比如在精細導航，目前室外的 GPS導航不到某個樓的樓層，依靠視覺定位的技術就可以精細到某個樓層的導航。還有虛擬廣告，通過拍攝的照片、相機的位置，可以把虛擬的畫插入進去。還有自助旅遊，對一個旅遊景點進行三維重建，如果遊客在這個場景裡行走，走到哪可以拍攝一張照片，通過拍攝的照片計算出位置，就可以基於這個位置對你進行服務。