“刷臉”坐火車，就是這麼酷科技頭條網

近幾年，全國各地的火車站的進站通道相繼啟用了人臉識別系統，持二代身份證和磁卡車票的旅客僅需三到六秒便可從該通道直接“刷臉”進站。那麼，這些系統的背後隱藏著哪些不為人知的人臉識別技術呢？讓我們一起進入今天的“走近人臉識別”。

人臉識別系統能夠給出一對人臉圖像的相似度，從而判斷兩張人臉是否是同一個人。當旅客持身份證刷臉時，系統會自動提取身份證和現場照的特徵進行比對，比對分數高於一個閾值則通過，否則核驗失敗。

目前，深度學習在人臉識別界具有統治地位，其使用深度網絡為每張圖像提取特徵，並要求同一個人照片的特徵相似度高，不同人照片的特徵相似度低。在訓練神經網絡時，基於分類的方法是主流，其將每個人當作獨立的類別，要求神經網絡能夠準確辨認出訓練集中的所有人。

然而，分類訓練的計算消耗與類別數直接相關。在實際場景下的人臉識別數據具有人數極多、但每人的平均樣本數極少的特點，他們通常由各大火車站、機場，以及各個銀行中的人證核驗系統收集而來。如下圖所示：

因此每個人的人臉圖片只有兩張，一張身份證照、一張現場照。但是數據中的人數是海量的，一般可達上百萬甚至千萬級，這種數據稱為大規模雙樣本數據。面對這些真實場景下的人證數據，現有的方法會遇到巨大的挑戰，例如類內變化不足使得訓練難以收斂以及海量類別數對計算設備的極端要求。

為了解決真實場景下的人證核驗問題，中科院自動化所提出了基於深度學習的大規模雙樣本學習方法。其中，為了應對雙樣本數據帶來的類內變化不足問題，研究人員提出了分類-驗證-分類的訓練策略來逐步提高人證核驗性能；為了降低海量樣本數帶來的計算壓力，提出了顯著樣本選擇來增強深度學習在超大規模分類上的擴展性。

在分類-驗證-分類（CVC）訓練策略中，整個訓練過程被分為三個階段。第一階段為 “預習”階段，其在類別均衡的名人數據庫上訓練深度神經網絡，以獲得基礎人臉知識。第二階段為“遷移學習”階段，其使用度量學習在大規模雙樣本數據上進行微調，將人臉知識從自然場景遷移到人證場景。第三階段為“強化學習”階段，其構建了一個特殊的分類層對百萬級類別進行大規模分類，最終達到人證場景下的最優性能。該分類層能夠尋找與當前樣本最相似的少數顯著類別進行訓練，極大降低大規模分類的計算需求。