3D人臉識別技術相關識別技術原理

喜歡就關注【港口大數據觀察】

3D人臉識別技術相關識別技術原理

對於刷臉消費、刷臉解鎖這些“黑科技”,人們其實一點都不陌生,但如果要深入其中,普通人也只能說出一個關鍵詞:人臉識別。

而人臉識別技術實際上可以區分為2D和3D兩種。

1、2D人臉識別:

2D人臉識別是目前最為常見的人臉識別技術之一,其工作原理是後期人臉識別系統對圖片中的人臉進識別,通過設定數百或數千個點,並記錄點與點之間的函數,該函數即為此人的面部信息。

2、3D人臉識別:

3D人臉識別是採用3D結構光技術,通過3D結構光內的數萬個光線點對人臉進行掃描後,從而提供更為精確的面部信息,而這類面部信息並不會受到口紅、粉底等化妝品的影響。與2D人臉識別相比,3D人臉識別將提供更為精確的面部數據,最終讓數據更加安全可靠。

“普通視覺傳感設備讓萬物看到世界,而3D傳感技術則讓萬物能像人一樣‘看清’世界。”

3D傳感技術原理

要談3D傳感技術,就必須先弄清楚光學測量分類以及其原理。

光學測量分為主動測距法和被動測距法。主動測距方法的基本思想是利用特定的、人為控制光源和聲源對物體目標進行照射,根據物體表面的反射特性及光學、聲學特性來獲取目標的三維信息。其特點是具有較高的測距精度、抗干擾能力和實時性,具有代表性的主動測距方法有結構光法、飛行時間法、和三角測距法。

主動測距法

結構光法

根據投影光束形態的不同,結構光法又可分為光點式結構光法、光條式結構光法和光面式結構光法等。

3D人臉識別技術相關識別技術原理


目前應用中較廣,且在深度測量中具有明顯優勢的方法是面結構光測量法。面結構光測量將各種模式的面結構投影到被測物體上,例如將分佈較密集的均勻光柵投影到被測物體上面,由於被測物體表面凹凸不平,具有不同的深度,所以表面反射回來的光柵條紋會隨著表面不同的深度發生畸變,這個過程可以看作是由物體表面的深度信息對光柵的條紋進行調製。所以被測物體的表面信息也就被調製在反射回來的光柵之中。通過被測物體反射回來的光柵與參考光柵之間的幾何關係,分析得到每一個被測點之間的高度差和深度信息。結構光的優點是計算簡單,測量精度較高,對於平坦的、無明顯紋理和形狀變化的表面區域都可進行精密的測量。其缺點是對設備和外界光線要求高,造價昂貴。目前,結構光法主要應用在條件良好的室內。

飛行時間法(ToF)

飛行時間(Time of Flight,簡稱ToF)法,又叫做激光雷達(LiDAR)測距法。它將脈衝激光信號投射到物體表面,反射信號沿幾乎相同路徑反向傳至接收器,利用發射和接收脈衝激光信號的時間差可實現被測量表面每個像素的距離測量。ToF直接利用光傳播特性,不需要進行灰度圖像的獲取與分析,因此距離的獲取不受物體表面性質的影響,可快速準確地獲取景物表面完整的三維信息。缺點則是需要較複雜的光電設備,價格偏貴。

三角測距法

三角測距法又稱主動三角法,是基於光學三角原理,根據光源、物體和檢測器三者之間的幾何成像關係來確定空間物體各點的三維座標。在實際測量過程中,它常用激光作為光源,用CCD相機作為檢測器。這種方式主要用於工業勘探、工件表面粗糙度檢測、輪胎檢測、飛機檢測等工業、航空、軍事領域,在消費電子類產品還不曾涉及。

被動測距法

被動測距技術不需要人為地設置輻射源,只利用場景在自然光照下的二維圖像來重建景物的三維信息,具有適應性強、實現手段靈活、造價低的優點。但是這種方法是用低維信號來計算高維信號的,所以其使用的算法複雜。被動測距按照使用的視覺傳感器數量可分為單目視覺、雙目立體視覺和多目視覺三大類。

單目視覺

單目視覺是指僅利用一臺照相機拍攝一張相片來進行測量。

3D人臉識別技術相關識別技術原理


因僅需要一臺相機,所以該方法的優點是結構簡單、相機標定容易,同時還避免了立體視覺的小視場問題和匹配困難問題。單目視覺方法又可分聚焦法和離焦法兩類。聚焦法是指首先使相機相對於被測點處於聚焦位置,然後根據透鏡成像公式求得被測點相對於相機的距離。相機偏離聚焦位置會帶來測量誤差,因此尋求精確的聚焦位置是關鍵所在。而離焦法不要求相機相對於被測點處於聚焦位置,而是根據標定出的離焦模型計算被測點相對於相機的距離,這樣就避免了由於尋求精確的聚焦位置而降低測量效率的問題,但離焦模型的準確標定是該方法的主要難點。

雙目立體視覺

雙目立體視覺的基本原理是從兩個視點觀察同一景物,以獲取在不同視角下的感知圖像,然後通過三角測量原理計算圖像像素間的位置偏差(視差)來獲取景物的三維信息。這一過程與人類視覺感知過程是類似的。

3D人臉識別技術相關識別技術原理


在雙目立體視覺系統的硬件結構中,通常採用兩個攝像機作為視覺信號的採集設備,通過雙輸入通道圖像採集卡與計算機連接,把攝像機採集到的模擬信號經過採樣、濾波、強化、模數轉換,最終向計算機提供圖像數據。一個完整的雙目立體視覺系統通常可分為數字圖像採集、相機標定、圖像預處理與特徵提取、圖像校正、立體匹配、三維重建六大部分。

多目立體視覺

多目立體視覺系統是對雙目視覺系統的一種拓展。

所謂多目立體視覺系統,就是採用多個攝像機設置於多個視點,或者由一個攝像機從多個視點觀測三維景物的視覺系統。對多目系統所採集到的景物圖像進行感知、識別和理解的技術被稱為多目立體視覺系統技術。

在雙目立體視覺中,對於給定的物體距離,視差與基線長度成正比,基線越長,對距離的計算越精確。但是當基線過長時,需要在相對較大的視覺範圍內進行搜索,從而增加計算量。利用多基線立體匹配是消除誤匹配、提高視差測量準確性的有效方法之。基線數目的增加可以通過增加相機來實現。

光電3D影像技術

根據獲取圖像信息方法的不同,光電3D影像技術分為有源和無源兩種技術,無源技術主要是接受物體的輻射或者環境的發射,有源技術是通過投射一束調製的或未調製的光到物體上通過檢測物體反射的光來形成3D圖像。

以前大多數技術研究集中在無源3D技術上,利用三角測量原理,通過兩臺相距一定距離的照相機,左邊照相機產生的圖像表示深度信息,右邊照相機產生差異的二維圖像。關鍵是產生深度信息的照相機需要分離出深度信息。無源3D影像技術需要拍攝的物體具有突出的輪廓特點,比如邊緣、角、線等。其優點是不需要特殊的硬件條件,併成功使用在好幾個方面。這種技術的缺點是需要兩臺或者更多的高質量的照相機、圖像處理軟件。圖像質量、拍照速度、數據傳輸等都是這種機制能否被廣泛應用的限制因素。

有源3D光電圖像方法是投射一束有規律的空間分佈的線狀光到物體上從而產生一個網狀格的深度。廣泛使用的有源光方法是飛行時間(time off light)方法,最近幾年,市場上出現的3D照相機都是基於飛行時間方法,這些3D照相機主要應用於工業控制,通過飛行時間方法檢測相位來實現3D影像。一束幾十兆赫茲被調製的近紅外光照射到物體上,物體反射的光進入3D照相機,由於立體物體的遠近距離不同,反射光的相位存在一個延遲,通過檢測原始光束以及反射光束的相位延遲從而檢測出物體的景深,從而實現3D圖像。這種3D圖像傳感器的製作由ZMD公司完成,ZMD公司根據3D圖像傳感器需要高速的特點從噪聲和速度進行工藝優化,響應速度可以到100MHz以上。

3D傳感技術的應用

其實,除了用於手機的人臉識別,3D傳感技術已經應用到了很多方面,在2018中國互聯網大會上,有國人廠家推出的智慧家庭新生態解決方案,賦予電視3D人臉識別、精準內容推薦、手勢交互等創新功能,顛覆智慧家庭客廳體驗。

通過3D人臉識別技術,電視可在不獲取用戶隱私的前提下,精準識別出機頂盒前的觀眾的用戶畫像信息,包括性別、年齡、情緒等等。同時,系統根據登錄的用戶角色信息,通過綜合統計分析該用戶角色的行為數據,可為用戶提供“千人千面”的個性化EPG界面,精準推薦電視節目、視頻點播、遊戲應用等內容。

此外,3D傳感技術可以賦能各行各業:首先是機器人廠商,尤其是服務性機器人的眼睛需要3D視覺技術,去感知周邊的環境,例如目標距離、障礙物等信息;其次是安防廠商,在傳統的安防攝像頭裡面再加裝一個視覺傳感器,就可以獲得一個更加精準的三維立體信息;還有門禁門鎖,3D的刷臉識別相比2D的刷臉識別,安全等級和精準性可以提升一級;最後,就手機行業的發展趨勢來說,3D傳感技術未來的應用空間很大,刷臉等生物識別都離不開3D傳感技術,此外VR、AR、美顏也可以搭載3D傳感技術去做一些交互性、娛樂性的體驗。還有各種各樣的智能硬件,凡是需要採集物體深度信息的相關功能,都會用到3D傳感技術。



分享到:


相關文章: