AutoML+自研AI芯片,依圖加速行人重識別(ReID)大規模商業化落地

人臉識別之後的下一個風口是什麼?

對於這個問題,業界似乎早已有了共識。從AI的人臉識別能力超越人類以來,學術界和產業界的目光逐漸轉向另一個更具科研意義和應用價值的課題——行人重識別(Person Re-identification,ReID)。

近日,依圖科技在ReID領域取得新突破,刷新業界三大權威數據集當前最優成績(SOTA),算法性能達到業界迄今最高標準,極大拓展了算法和應用的邊界。

AutoML+自研AI芯片,依图加速行人重识别(ReID)大规模商业化落地

注:YITU算法結果在不利用時空信息,不進行重排再優化(Re-ranking),等限制下取得

還記得2018年底依圖進軍智能語音,隨即在中文語音識別領域創下識別精度的新紀錄。2019年5月推出全球首顆雲端視覺AI芯片,而且“發佈即商用”。似乎無論進入哪個技術領域,依圖都能快速將行業整體水平推至新的高點,並加速技術的產業化落地。

這背後的關鍵是什麼?

行人重識別(ReID),人臉識別後的“殺手級應用”

在交通運輸、工業製造和城市規劃等實際場景下,99%的圖像都是不含人臉或人臉部分是極其模糊的,僅有幾個像素大小,這時候人臉識別的作用較為有限。

行人重識別(ReID,也稱“行人再識別”),是指在多攝像設備網絡下對行人進行檢索,利用步態動作、身體特徵等更為全面的信息來識別人物,無論單獨使用還是與人臉識別相結合,都能發揮更大的應用價值。

除了智能零售、智慧交通、智能城市等經常提及的應用場景,ReID技術的應用也將使日常生活更加便捷:遊樂園更易尋找走失兒童、寵物/家庭機器人可以憑背影準確識別主人或顧客並提供相應服務。

然而,由於ReID需要從不同攝像機拍攝的圖像或視頻中找出同一個人物,而這些攝像機所覆蓋的範圍彼此並不重疊,導致缺乏連貫的信息,而且不同畫面中人物的姿態、行為甚至外觀(比如: 正身、側身、背身)會發生較大變化,不同時間、場景的光照、背景和遮擋物各不相同(背景中常還有體型、衣著相似的其他人物干擾),攝像機的分辨率也有高有低,人物在畫面中出現的位置有遠有進, 這些都對ReID技術提出了極大的挑戰。

深度優化ReID算法框架,AutoML取代人工算法調優

依圖科技憑藉自身工程與研發實力,深度優化了ReID算法框架,顯著提升了算法效率,通過結合AutoML等前沿技術,進一步創新性地實現了模型參數的自動搜索與迭代,突破了依賴算法研究員手工設計與調優的傳統算法開發流程,在降低人力成本的同時,使得算法的泛化性能更強。

此次依圖自研算法在業界最具影響力的三大ReID數據集Market1501、DukeMTMC-ReID、CUHK03上,將衡量算法性能的兩大關鍵指標“首位命中率”(Rank- 1 Accuracy)及“平均精度均值”(Mean Average Precision,mAP)6項數據全部提升,充分顯示了依圖的技術實力,進一步穩固了中國技術團隊在該任務下領跑地位。

需要指出,首位命中率高,只意味著算法能夠在眾多圖像中準確找出最容易識別或者說匹配的那張,並不能反應模型的真實能力,尤其是應對複雜場景的表現。

因此,評價ReID算法性能時需要結合mAP值,它反映的是系統的綜合檢索性能。mAP值越高,說明系統的實用性越好,既能查得全也能查得準,能夠較好地應對多遮擋、光線暗、畫面模糊等情況。

算法+算力,加速ReID商業化落地加速

面對又一項業界紀錄,依圖團隊卻十分平靜。依圖研發人員表示,這次刷榜只是一次嘗試,依圖在工業界實戰落地的ReID項目,其規模與問題的複雜程度已經遠超三大數據集,可以說,學術界現有ReID基準已經無法體現工業界算法的最高水平。

舉個例子, Market-1501在清華大學內採集,行人(ID)基本上是穿短袖、短褲和裙裝的亞洲人,DukeMTMC-reID在杜克大學內採集,ID主要是身著冬季服飾的歐美人, 這些在特定場景, 特定時間段採集的數據往往與真實世界中的圖像分佈不一致。在真實場景下ReID算法需要做到在跨時間段, 跨場景, 跨不同成像質量的圖像採集設備下進行高精度的快速識別. 其數據分佈遠遠與問題複雜程度遠遠大於現有的學術數據集。

這些現實因素導致了現有ReID學術界數據集無法有效模擬或者還原實際真實情況。因此,基於現有ReID數據集的基準具有很大的侷限性。依圖研究人員表示,業界需要更好的ReID數據集,也需要更全面的算法衡量數據集,至少對於商業化落地的算法是如此。

實戰場景下的ReID任務,不僅對算法提出更高要求,也需要更高效的芯片提供強大的算力支持,二者缺少任意一個,都會影響ReID的實際應用價值。目前看來,依圖是當下同時具備算法和算力能力的公司。依圖在2017年投入雲端AI芯片QuestCore™(求索)的研發,並於2019年5月“發佈即商用”。QuestCore™是全球首顆雲端視覺AI芯片,提供強大算力,單路攝像頭功耗不到1W。

在ReID實戰應用中,依圖研發人員針對本次提出的算法做了進一步優化, 依託依圖自研AI芯片, 在僅憑穿著、體態特徵的條件下,已能將ReID做到2017年~2018年人臉識別的精度。這不僅加速了ReID的大規模商業化落地,更解鎖了新的應用場景。

2017年,以蘋果FaceID為代表的人臉識別商業化應用開始在全球範圍內普及。如今,刷臉支付、刷臉乘車已經滲透到我們的日常生活。有理由相信,世界級的ReID算法,加上自研AI芯片, 業界期待的下一個計算機視覺領域“殺手級應用”已經到來。

雷鋒網雷鋒網


分享到:


相關文章: