商湯 37 篇論文入選 ECCV 2018,開源 mm-detection 檢測庫

雷鋒網 AI 科技評論消息,9 月 8 日-14 日,2018 歐洲計算機視覺大會(ECCV 2018)在德國慕尼黑召開,ECCV 每兩年舉辦一次,與 CVPR、ICCV 共稱為計算機視覺領域三大頂級學術會議,每年錄用論文約 300 篇。根據 ECCV 2018 宣佈的最終結果,商湯科技及聯合實驗室共有 37 篇論文入選,主要集中在以下領域:大規模人臉與人體識別、物體檢測與跟蹤、自動駕駛場景理解與分析、視頻分析、3D 視覺、底層視覺算法、視覺與自然語言的綜合理解等。此外,商湯科技在 2018 年 COCO 比賽物體檢測(Detection)項目中奪得冠軍,開源 mm-detection 檢測庫。憑藉以上事項,商湯科技在雷鋒網旗下學術頻道 AI 科技評論數據庫產品「AI 影響因子」中有相應加分。

在商湯入選 ECCV 2018 論文《人臉識別的瓶頸在於數據集噪聲(The Devil of Face Recognition is in the Noise)》中,對於現有人臉數據集中的標籤噪聲問題進行了深入研究,對 MegaFace 和 MS-Celeb-1M 數據集中的噪聲特性和來源做了全面的分析,發現乾淨子集對於提高人臉識別精度效果顯著。

商汤 37 篇论文入选 ECCV 2018,开源 mm-detection 检测库

在入選論文《量化模仿-訓練面向物體檢測的極小 CNN 模型(Quantization Mimic: Towards Very Tiny CNN for Object Detection)》中,提出了一種簡單而通用的框架—量化模仿,來訓練面向物體檢測任務的極小 CNN 模型。作者提出聯合模仿與量化的方法來減小物體檢測 CNN 模型的參數量實現加速。在有限計算量的限制下,該框架在 Pascal VOC 和 WIDER Face 數據集的物體檢測性能均超越了當前物體檢測的先進水平。

商汤 37 篇论文入选 ECCV 2018,开源 mm-detection 检测库

在 2018 年的 COCO 比賽中,商湯科技研究員和香港中文大學-商湯聯合實驗室同學組成的團隊在物體檢測(Detection)項目中奪得冠軍。在此次競賽中,商湯糰隊開發瞭如下三項全新技術,獲得了大幅度的性能提升:

(1)新的多任務混合級聯架構(hybrid cascade)。通過把不同子任務進行逐級混合,這種新架構有效地改善了整個檢測過程中的信息流動。

(2)通過特徵導引產生稀疏錨點,而不是使用傳統的規則分佈的密集錨點。這種特徵導引的方案使得錨點的投放更為精準,平均召回率提升了超過10個百分點。

(3)採用一種新型的FishNet網絡結構,它有效地保留和修正多個尺度的信息,能更有效地用於圖像級,區域級,以及像素級預測任務。

在 test-dev 上,商湯糰隊對上述框架進行了全面測試,其中單模型和多模型(最終提交的結果來自於五個模型混合的框架)的 mask AP 分別達到了 47.4% 和 49.0%,比去年冠軍(也是商湯糰隊獲得)的結果(44.0% 和 46.3%)有約 3 個百分點的明顯提高。在傳統的基於檢測框的指標 bbox AP 上,這個新的框架也分別達到了單模型 54.1% 和多模型的 56.0% 的性能,比去年冠軍的結果(50.5% 和 52.6%)也有較大的提升。

此外,在 ECCV 期間,香港中文大學-商湯聯合實驗室還開源了檢測庫 mm-detection(https://github.com/open-mmlab/mmdetection),這個開源庫提供了已公開發表的多種視覺檢測核心模塊,通過這些模塊的組合,可以迅速搭建出各種著名的檢測框架,比如 Faster RCNN,Mask RCNN 和 R-FCN 等,以及各種新型框架,從而大大加快檢測技術研究的效率。


分享到:


相關文章: