無界零售的「鷹眼「:京東實現多任務人臉屬性識別

人臉作為最重要的生物特徵,蘊含了大量的屬性信息,如性別、種族、年齡、表情、顏值等,而如何對這些屬性信息進行預測,則是人臉分析領域的研究熱點之一。

近兩年,隨著人臉識別技術的快速發展,“刷臉”逐漸成為新時期生物識別技術應用的主要領域。甚至有人將2017年定義成“刷臉”元年,人臉識別迎來了井噴式的爆發。在手機娛樂、零售、金融、支付、電信、交通、樓宇、社區等領域迎來廣泛的應用,影響著人類生活的方方面面。

京東AI人臉屬性識別系統實現多任務人臉屬性識別

目前,現有的人臉屬性識別方法主要是針對單一任務,如限制於年齡判斷、性別識別等某一單項任務預測。對於多個屬性的識別需求,現有單任務的人臉屬性算法很難擴展至多任務的屬性識別。若同時對多個單一任務進行集成,則算法複雜度和耗時則會大大增加,不利於系統的部署。因此,設計多任務的人臉屬性算法,同時預測出人臉的多個屬性,並開發出相應的多任務人臉屬性識別實時系統,仍然是研究的難點。

針對這種情況,京東AI研究院推出一種新型的人臉屬性識別系統,在實時多任務人臉屬性識別上取得重大進展。經過大量研究投入,該人臉屬性識別系統通過採用深度學習卷積神經網絡進行分類或迴歸的方式、模型基於多任務學習,使得不同屬性之間可輔助進行預測,實現實時人臉屬性預測。

該系統主要流程包括人臉檢測,關鍵點定位,人臉校正和屬性識別四個部分。首先檢測圖片中的人臉,對於檢測到的每張人臉,識別各項人臉屬性,包括性別,種族,年齡,笑臉、顏值等信息。

人臉檢測。檢測圖片上是否出現人臉,它的位置及大小。基於深度學習的人臉檢測算法採用多個網絡分支進行多尺度的人臉檢測,從而融合了多層的信息,使得保證高精度的前提下,實現快速實時的人臉檢測。

關鍵點定位。在檢測到人臉之後,算法繼續確定出鼻子、眼睛、嘴巴等位置以及人臉輪廓,實現人臉關鍵點的定位。京東AI平臺與研究部的人臉關鍵點定位採用25-106個關鍵點回歸算法,設計專門的網絡架構並根據關鍵點的輸出與真實值不斷調整迴歸的參數。針對姿態較大的人臉,採用3D擬合算法,生成出相應地大姿態訓練集,使得整體算法對於大姿態的人臉關鍵點定位更為魯棒,並據此設計出半自動人臉關鍵點標註算法。訓練得到的模型可精確確定出鼻子,嘴巴,眼睛,眉毛,輪廓等位置。

人臉屬性的識別。用戶感興趣的人臉屬性包含很多,比如人臉的年齡,性別,表情,種族,鬍子,是否佩戴飾品等等類型。該階段通常採用深度學習卷積神經網絡進行分類或迴歸,模型基於多任務學習,使得不同屬性之間可輔助進行預測。

作為無界零售的基礎設施之一,以及依託京東廣闊的應用場景,該人臉屬性識別系統將很快在不同項目上開花結果,這也意味著京東AI在感知用戶需求的“鷹眼”上取得了很大的進展。

重構“人、貨、場” 提升零售業的交互體驗

零售業正在經歷最深的變革,其中很重要的一項就是門店的數字化。

傳統商家往往通過會員的方式留存客戶,例如收集會員的消費記錄、品牌偏好、消費金額、消費頻率、姓名、手機號等結構化數據,然而這些寬泛的數據維度依然相對粗放,收集起來後並沒有良好的運轉起來,而是靜靜的“躺著”。對商家在進一步制定相關運營決策時所能起到的參考作用十分有限。

人臉屬性識別技術則能從源頭上實現實體門店的用戶數據採集,解決這個問題。通過智能攝像頭識別進店用戶屬性,進行目標顧客群體分析,獲得消費者群體分佈、活動軌跡、到訪記錄、消費行為或喜好等諸多詳細信息,進行精細化管理。同時,再結合傳統的會員體系、ERP等數據,通過深度學習對融合後數據進行建模,智能解決門店需要進什麼貨、什麼時候進貨、進多少貨的選品問題。

用戶端的體驗也不斷提升。人臉屬性識別技術可以識別到顧客的年齡、性別、歷時記錄等信息來向顧客提出個性化建議,使用戶免受其它因素帶來的干擾直奔目的地,協助找到完全符合用戶獨特需求與風格的產品。同時,在線下營銷互動也有廣闊的應用前景。以往線下場景的營銷存在流量“浪費”、不對稱的情況,降低了購物體驗。例如線下門店的廣告電子屏,現在可根據用戶畫像推薦顧客可能感興趣產品,與用戶產生良性互動。

下面這張圖是在京東618啟動大會上,JDAI-Face京東人臉屬性識別系統現場與觀眾進行互動,效果圖如下:

無界零售的“鷹眼“:京東實現多任務人臉屬性識別

從效果分析可知,現場的男女性別比例大概是6:4,年齡分佈主要集中在18-30歲之間的青年,顏值較高的參會人員比例較大。從這些屬性的分佈情況,再基於人臉屬性值信息,匹配預先設定好的業務內容,就可精準的進行推送。

京東人臉屬性識別系統作為無界零售的“鷹眼”,將助力傳統零售業轉型升級,在未來的零售變革中發揮出巨大的價值,在消費升級的背景下,真正的去感知用戶的需求。


分享到:


相關文章: