04.13 人臉識別算法之基於視頻圖像的識別算法

一個典型的基於視頻圖像的人臉識別系統一般都是自動檢測人臉區域,從視頻中提取特徵,最後如果人臉存在則識別出人臉的身份。在視頻監控、信息安全和出入控制等應用中,基於視頻的人臉識別是一個非常重要的問題,也是目前人臉識別的一個熱點和難點。基於視頻比基於靜態圖像更具優越性,因為 Bruce 等人和 Knight 等人已證明,當人臉被求反或倒轉時,運動信息有助於(熟悉的)人臉的識別。雖然視頻人臉識別是基於靜態圖像的人臉識別的直接擴展,但一般認為視頻人臉識別算法需要同時用到空間和時間信息,這類方法直到近幾年才開始受到重視並需要進一步的研究和發展。目前視頻人臉識別還有很多困難和挑戰,具體來說有以下幾種:

1、視頻圖像質量比較差:視頻圖像一般是在戶外(或室內,但是採集條件比較差)獲取的,通常沒有用戶的配合,所以視頻人臉圖像經常會有很大的光照和姿態變化。另外還可能會有遮擋和偽裝。

2、人臉圖像比較小:同樣,由於採集條件比較差,視頻人臉圖像一般會比基於靜態圖像的人臉識別系統的預設尺寸小。小尺寸的圖像不但會影響識別算法的性能,而且還會影響人臉檢測,分割和關鍵點定位的精度,這必然會導致整個人臉識別系統性能的下降。

視頻人臉識別起源於基於靜態圖像的人臉識別,即識別系統自動的檢測和分割出人臉,然後用基於靜態圖像的識別方法進行識別。對這類方法的一個提高是加入了人臉跟蹤。在這類系統中,通過利用姿態和從視頻中估計到的深度信息合成一個虛擬的正面人臉。這個階段的另外一個能提高識別率的方法是利用視頻中充裕的幀圖像,基於每幀圖像的識別結果,使用 ” 投票 ” 機制。投票方法可以是確定的,但是概率投票方法一般來說更好。投票機制的一個缺點是計算結果的代價比較昂貴。

視頻人臉識別的第二個發展階段是利用多模態信息。因為人類一般會利用多種信息識別人的身份,所以一個多模態系統將比只利用人臉的識別系統性能更好。更重要的是利用多模態信息提供了一種方法,它能全面解決那些只靠人臉無法識別的任務。例如,在一個完全沒有配合的環境(比如搶劫),歹徒的臉一般是蒙著的,這時唯一能進行無人臉識別的方法就是分析歹徒軀體的運動特性。除了指紋,人臉和聲音是最常用於身份識別的信息。它們已經被用於很多多模態身份識別系統。 1997 年以來,每兩年,就會召開一個專門關於基於視頻和語音身份識別的國際會議。

最近幾年,視頻人臉識別進入第三個發展階段,這個階段方法的特點是同時採用空間信息(在每幀中)和時間信息(比如人臉特徵的運動軌跡)。區別於概率投票方法的一個很大的不同之處在於,此類方法是在時間和空間的聯合空間中描述人臉和識別人臉的。

視頻圖像的一個非常重要的特性是它的時間連續性,以及由此產生的人臉信息的不確定性。在人臉跟蹤和識別中利用時間信息是視頻人臉識別算法和基於靜態圖像的人臉識別算法的最大區別。目前這類算法大致可分為兩類:

1、 跟蹤 - 然後 - 識別,這類方法首先檢測出人臉,然後跟蹤人臉特徵隨時間的變化。當捕捉到一幀符合一定標準(大小,姿勢)的圖像時,用基於靜態圖像的人臉識別算法進行識別。這類方法中跟蹤和識別是單獨進行的,時間信息只在跟蹤階段用到。識別還是採用基於靜態圖像的方法,沒用到時間信息。

2、 跟蹤 - 且 - 識別,這類方法中,人臉跟蹤和識別是同時進行的,時間信息在跟蹤階段和識別階段都用到。


分享到:


相關文章: