CVPR 2020論文開源項目一頁看盡，附代碼論文

2020-03-09 12:32:55 量子位

十三發自凹非寺
量子位報道 | 公眾號 QbitAI

CVPR 2020中選論文放榜後，最新開源項目合集也來了。

本屆CPVR共接收6656篇論文，中選1470篇，“中標率”只有22%，堪稱十年來最難的一屆。

刨去接受率低這件事，從論文本身出發，在中選論文中還是有很多值得我們去借鑑和學習的精品。

今日GitHub上便出現了一個項目，將本屆CVPR論文開源項目做了個集合。

本文便基於此GitHub項目，對中選CVPR 2020論文的開源項目做了整理，主要內容如下：

目標檢測

論文題目：

Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection

本文首先指出了基於錨點檢測與無錨點檢測的本質區別，在於如何定義正、負訓練樣本，從而導致兩者之間的性能差距。

研究人員提出了一種自適應訓練樣本選擇 (ATSS)，根據對象的統計特徵自動選擇正樣本和負樣本。它顯著地提高了基於錨點和無錨點探測器的性能，並彌補了兩者之間的差距。

最後，還討論了在圖像上每個位置平鋪多個錨點來檢測目標的必要性。

論文地址：https://arxiv.org/abs/1912.02424

代碼：https://github.com/sfzhang15/ATSS

目標跟蹤

論文題目：

MAST: A Memory-Augmented Self-supervised Tracker(注：不確定是否中選)

這篇論文提出了一種密集的視頻跟蹤模型 (無任何註釋)，在現有的基準上大大超過了之前的自監督方法(+15%)，並實現了與監督方法相當的性能。

首先通過深入的實驗，重新評估用於自監督訓練和重建損失的傳統選擇。其次，通過使用一個重要的內存組件來擴展架構，從而進一步改進現有的方法。而後，對大規模半監督視頻對象分割進行了基準測試，提出了一種新的度量方法：可泛化 (generalizability)。

論文地址：https://arxiv.org/abs/2002.07793

代碼：https://github.com/zlai0/MAST

實例分割

論文題目：

PolarMask: Single Shot Instance Segmentation with Polar Representation

本文提出了PolarMask方法，是一種single shot的實例分割框架。PolarMask基於FCOS，把實例分割統一到了FCN的框架下。

FCOS本質上是一種FCN的dense prediction的檢測框架，可以在性能上不輸anchor based的目標檢測方法。

貢獻在於，把更復雜的實例分割問題，轉化成在網絡設計和計算量複雜度上和物體檢測一樣複雜的任務，把對實例分割的建模變得簡單和高效。

論文地址：https://arxiv.org/abs/1909.13226

代碼：https://github.com/xieenze/PolarMask

CenterMask : Real-Time Anchor-Free Instance Segmentation

論文地址：https://arxiv.org/abs/1911.06667

代碼：https://github.com/youngwanLEE/CenterMask

Deep Snake for Real-Time Instance Segmentation

論文地址：https://arxiv.org/abs/2001.01629

代碼：https://github.com/zju3dv/snake

NAS

論文題目：

CARS: Continuous Evolution for Efficient Neural Architecture Search

在本文中，研究人員開發了一種高效的連續演化方法來搜索神經網絡。

在最近的迭代中，在一個超網中共享參數的種群中的架構，將在具有幾個epoch的訓練數據集上進行調優。下一個演化迭代中的搜索將直接繼承超網和種群，加速了最優網絡的生成。進一步採用非支配排序策略，僅保留Pareto前沿的結果，以精確更新超網。

經過0.4天的GPU連續搜索，可以生成多個模型大小和性能不同的神經網絡。這些網絡超過了基準ImageNet數據集上最先進方法產生的網絡。

論文地址：https://arxiv.org/abs/1909.04977

代碼(即將開源)：https://github.com/huawei-noah/CARS

人臉表情識別

論文題目：

Suppressing Uncertainties for Large-Scale Facial Expression Recognition

本文提出了一種簡單而有效的自修復網絡(SCN)，它能有效地抑制不確定性，防止深度網絡對不確定的人臉圖像進行過擬合。

具體來說，SCN從兩個不同的方面抑制了不確定性：⑴在小批量上的自關注機制，通過排名規則化對每個訓練樣本進行加權；⑵重新貼標籤機制，在排名最低的組中修改這些樣本的標籤。

論文地址：https://arxiv.org/abs/2002.10392

代碼(即將開源)：https://github.com/kaiwang960112/Self-Cure-Network

人體姿態估計

2D人體姿態估計

論文題目：

The Devil is in the Details: Delving into Unbiased Data Processing for Human Pose Estimation

所有計算機視覺的任務都需要和數據處理打交道，但在關鍵點檢測問題上，數據處理顯得尤為重要。在關鍵點檢測任務上，數據處理尚未被系統的學習，因此這篇文章關注了人體關鍵點檢測問題的數據處理，認為它是算法的一個極其重要的組成部分。

在系統地分析這個問題的時候，發現現有的所有的state-of-the-art在這個環節上都會存在兩個方面的問題：一個是在測試過程中，如果使用flip ensemble時，由翻轉圖像得到的結果和原圖得到的結果並不對齊。另外一個是使用的編碼解碼(encoding-decoding)方法存在較大的統計誤差。

這兩個問題耦合在一起，產生的影響包括：估計的結果不準確、復現指標困難、有較大可能使得實驗的結果結論不可靠。

論文地址：https://arxiv.org/abs/1911.07524

代碼：https://github.com/HuangJunJie2017/UDP-Pose

Distribution-Aware Coordinate Representation for Human Pose Estimation

論文地址：https://arxiv.org/abs/1910.06278

代碼：https://github.com/ilovepose/DarkPose

3D人體姿態估計

論文題目：

VIBE: Video Inference for Human Body Pose and Shape Estimation

由於缺乏用於訓練的ground-truth三維運動數據，現有的基於視頻的最先進的方法無法生成準確和自然的運動序列。

為了解決這個問題，本文提出了身體姿態和形狀估計的視頻推理(VIBE)，它利用了現有的大型動作捕捉數據集(AMASS)和未配對的、in-the-wild 2D關鍵點註釋。

關鍵創新是一個對抗性學習框架，它利用AMASS來區分真實的人類動作和由時間姿態、形狀迴歸網絡產生的動作。

論文地址：https://arxiv.org/abs/1912.05656

代碼：https://github.com/mkocabas/VIBE

Compressed Volumetric Heatmaps for Multi-Person 3D Pose Estimation

論文地址：暫無

代碼：https://github.com/anonymous-goat/CVPR-2020

點雲

點雲分類

論文題目：

PointAugment: an Auto-Augmentation Framework for Point Cloud Classification

本文提出了一種新的自動增強框架PointAugment，該框架在訓練分類網絡時自動優化和增強點雲樣本，以豐富數據多樣性。

還建立了一個可學習的點增強函數，該函數具有形狀上的變換和點上的位移，並根據分類器的學習過程，精心設計了損失函數來採用增廣後的樣本。

論文地址：https://arxiv.org/abs/2002.10876

代碼(即將開源)：https://github.com/liruihui/PointAugment/

場景文本檢測/識別

論文題目：

ABCNet: Real-time Scene Text Spotting with Adaptive Bezier-Curve Network

本文提出了自適應Bezier曲線網絡(ABCNet)，主要貢獻包括：⑴第一次通過參數化的Bezier曲線自適應地擬合任意形狀的文本；⑵設計了一種新穎的BezierAlign層，用於提取具有任意形狀的文本實例的精確卷積特徵；⑶方法在效率和準確性上都具有優勢。

論文地址：https://arxiv.org/abs/2002.10200

代碼(即將開源)：https://github.com/Yuliang-Liu/bezier_curve_text_spottinghttps://github.com/aim-uofa/adet

超分辨率

視頻超分辨率

論文題目：

Zooming Slow-Mo: Fast and Accurate One-Stage Space-Time Video Super-Resolution

本文探討了時空視頻的超分辨率任務，該任務旨在從低幀率(LFR)、低分辨率(LR)視頻中生成高分辨率(HR)慢動作視頻。

研究人員提出了一種基於LFR、LR視頻直接合成HR慢動作視頻的，單級空時視頻超分辨率框架。

除此之外，還提出了一種可變形凸STM來同時對齊和聚合時態信息，以更好地利用全局時態上下文。最後，利用深度重構網絡對HR慢動作視頻幀進行預測。

論文地址：https://arxiv.org/abs/2002.11616

代碼：https://github.com/Mukosame/Zooming-Slow-Mo-CVPR-2020

視覺語言導航

論文題目：

Towards Learning a Generic Agent for Vision-and-Language Navigation via Pre-training

本文提出了視覺和語言導航(VLN)任務的第一個預訓練和微調範例。

通過以自監督的學習方式訓練大量的圖像-文本-動作三元組，預訓練模型提供了視覺環境和語言指令的通用表示。

論文地址：https://arxiv.org/abs/2002.10638

代碼(即將開源)：https://github.com/weituo12321/PREVALENT

其他

GhostNet: More Features from Cheap Operations

論文地址：https://arxiv.org/abs/1911.11907

代碼：https://github.com/iamhankai/ghostnet

AdderNet: Do We Really Need Multiplications in Deep Learning?

論文地址：https://arxiv.org/abs/1912.13200

代碼：https://github.com/huawei-noah/AdderNet

Deep Image Harmonization via Domain Verification

論文地址：https://arxiv.org/abs/1911.13239

代碼：https://github.com/bcmi/Image_Harmonization_Datasets

其他GitHub論文項目地址：

https://github.com/charlesCXK/3D-SketchAware-SSC

https://github.com/Anonymous20192020/Anonymous_CVPR5767

https://github.com/avirambh/ScopeFlow

https://github.com/csbhr/CDVD-TSP

https://github.com/ymcidence/TBH

https://github.com/yaoyao-liu/mnemonics

https://github.com/meder411/Tangent-Images

https://github.com/KaihuaTang/Scene-Graph-Benchmark.pytorch

https://github.com/sjmoran/deep_local_parametric_filters

https://github.com/charlesCXK/3D-SketchAware-SSC

https://github.com/bermanmaxim/AOWS

最後，本項目是由公眾號CVer編輯Amusi整理，同時歡迎各位大佬提交issue，分享CVPR 2020開源項目。

傳送門

GitHub項目地址：
https://github.com/amusi/CVPR2020-Code

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們，第一時間獲知前沿科技動態

分享到:

閱讀更多 量子位 的文章

關鍵字: 項目網頁設計開源

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"

CVPR 2020論文開源項目一頁看盡，附代碼論文

目標檢測

目標跟蹤

實例分割

NAS

人臉表情識別

人體姿態估計

2D人體姿態估計

3D人體姿態估計

點雲

點雲分類

場景文本檢測/識別

超分辨率

視頻超分辨率

視覺語言導航

其他

傳送門

相關文章:

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

MySQL中OOM故障應如何下手-愛可生

像專家一樣使用 panic

30種不同的編程語言怎麼寫“Hello, World”

percona QAN 介紹

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

網絡工程師職業生涯中，哪兩點是最重要的？

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

Hive分桶表

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

第一章 Spring Framework概述

opencv人工智能深度學習這樣實現人臉的年齡檢測

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

Redis內存分析工具--rdr安裝與使用

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

一行代碼提升遷移性能

利用相似幾何信息，做可泛化3D形狀分割模型

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

分佈式緩存，真香

特徵工程的力量

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

SpringBoot如何優雅的使用RocketMQ

css代碼規範工具stylelint

上海郊區買房松江，青浦，買哪裡？

汽車電池耗光一次，要換嗎？

都知道汽車短途行車會影響電瓶壽命，可是具體到多少里程，才算影響電瓶壽命的短途呢？

你認為上海本地話就是上海話嗎？

九州是哪九州，現在都屬於哪些地區？

為什麼有些司機退出了滴滴平臺？

物業應該幹哪些工作？由誰來監督物業？

為什麼上海話那麼“軟”？感覺就好像是為女人設計的方言？

手裡有十萬塊錢，是放餘額寶裡面好，還是放微信？

馬上就要去上海了，有沒有朋友教幾句厲害的上海話？

中國方言“最難聽懂”的城市，語言體系比較複雜，你覺得是哪裡呢？

既然上海是國際大都市，公交車上用的普通話和上海話，為啥不用普通話跟英語呢？

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪