100%揭穿偽造人臉圖像,道高一丈反Deep Fake

一週AI最火論文 | 100%揭穿偽造人臉圖像,道高一丈反Deep Fake

大數據文摘專欄作品

作者:Christopher Dossman

編譯:Joey、Luna、雲舟


嗚啦啦啦啦啦啦啦大家好,本週的AI Scholar Weekly欄目又和大家見面啦!

AI ScholarWeekly是AI領域的學術專欄,致力於為你帶來最新潮、最全面、最深度的AI學術概覽,一網打盡每週AI學術的前沿資訊。

每週更新,做AI科研,每週從這一篇開始就夠啦


本週關鍵詞:文本理解、Python、姿勢估計


本週最佳學術研究


通用文本理解模型的軟件工具包


本文介紹了jiant,這是一個NLP領域的新開源包,它使研究人員可以使用最新的自然語言處理模型對各種自然語言理解任務進行快速實驗,並同時支持探測、轉移學習和多任務訓練的實驗。該工具包目前仍處於持續開發階段。


這個工具基於PyTorch,並使用了AllenNLP和HuggingFace PyTorch轉換器包中的許多組件。Jiant目前實現了超過50項自然語言理解任務,包括所有GLUE和SuperGLUE基準測試任務。


作為由配置驅動的框架,jiant使得研究者可以通過簡單地編寫配置文件來運行各種各樣的實驗。如果需要添加新功能,也可以輕鬆地編輯或擴展代碼。


這一框架的代碼是開源的,開發團隊也正在邀請更多人加入開發、公開問題或向本項目提交Pull Request


GitHub:

https://github.com/nyu-mll/jiant/

https://arxiv.org/abs/2003.02249v1


Python中的機器學習:數據科學,機器學習和人工智能的主要發展和技術趨勢


Python因易於學習而廣為人知,並且仍然是數據科學、機器學習和科學計算中使用最廣泛的語言。KDnuggets最近的一項涉及1,800多名參與者的調查表明,2019年這一領域最廣泛使用的語言仍然是Python。


一週AI最火論文 | 100%揭穿偽造人臉圖像,道高一丈反Deep Fake


這篇研究論文旨在向讀者介紹當前在使用Python進行機器學習研究中最流行的主題和趨勢。研究人員進行了一項調查,深入瞭解了Python在機器學習領域的應用,並總結了一些重大挑戰、分類法和方法。在本文中,他們努力在學術研究和行業主題之間找尋平衡,並同時重點介紹了最相關的工具和軟件庫。


作為一種易於學習和使用的語言,Python已經發展成為在許多研究和應用領域中流行的語言。隨著CPU和GPU計算的發展以及Python用戶社區的不斷增長,該語言有望在未來許多年內繼續成為科學計算機的主流語言。


對於本領域的研究人員來說,該調查涵蓋了廣泛使用的框架和概念,它們被收集在一起並進行了整體比較,目的是為讀者提供最準確的信息並推動Python機器學習領域的發展。


https://arxiv.org/abs/2002.04803v1


使用多任務深度學習的2D / 3D姿勢估計和動作識別


在本文中,研究人員提出了一個多任務框架,使用單眼彩色圖像估計2D或3D人體姿勢,並從視頻序列中對人類動作進行分類。


之所以如此,是因為人體姿勢估計和動作識別都強烈依賴於人體的表示和分析。但是,僅當涉及到最新技術時,才能分別處理這兩個問題。


這項研究現在表明,可以使用一種方法有效地解決這兩個問題,並且這一算法在以每秒100幀以上的速度運行時,仍然可以在每個任務上達到最新或相當的結果。


所提出的3D姿勢方法提供了對具有低分辨率特徵圖的高精度估計,並且通過預測每個人體關節的專門深度圖,從而不需要價格昂貴的體積熱圖。


在四個數據集(MPII,Human3.6M,Penn Action和NTU RGB + D)上的運算結果表明該方法在目標任務上表現良好。該方法可以使用混合的2D和3D數據進行訓練,這得益於精確的室內3D數據,以及使用手動註釋的2D“野外”圖像,這證明了3D姿勢估計的顯著改進。而且,該方法還可以同時以無縫方式用單幀和視頻剪輯進行訓練。


Demo視頻:

https://www.youtube.com/watch?v=MNEZACbFA4Y&t=6s

代碼:

https://github.com/dluvizon/deephar

https://arxiv.org/abs/1912.08077v2


一個新型檢測偽造人臉圖片的方法


這些年,由於機器學習和深度學習發展迅猛,假冒數字內容也相應激增。虛假數字內容引起了人們越來越多的關注,並且讓大家對圖像內容的不信任感日益蔓延。這種需求,導致大家迫切地需要一種自動化的檢測偽造圖像的技術。


為了區分出哪些是AI生成的假人臉圖像,一群德國研究人員最近推出了一種新方法,並且成功地檢測出了虛假人臉圖片。具體來說,他們提出了一種基於經典頻域分析和簡單分類的機器學習新方法。


這個方法對特定圖像有100%的檢測準確度,主要適用範圍是GANs兩個數據集中高分辨率和中等分辨率的假人臉圖片。與需要提供大量標記數據的現有技術水平相比,這個新的技術能在使用很少的帶註釋的訓練樣本的情況下,達到非常準確的結果,並且全程完全無監督。


如果能拿到高分辨率的圖像,並且不少於20個帶註釋的樣本對這個模型進行訓練,這個方法可實現100%的完美檢測率。研究人員還將此模型運用於主流的其他假圖片集,其準確度也能達到91%。


代碼:

https://github.com/cc-hpc-itwm/DeepFakeDetection

https://arxiv.org/abs/1911.00686v3


把服裝轉移到3D人體模型身上


將服裝自動轉移到3D人體模型這個技術,對於人類照片真實感的渲染、綜合性數據學習、虛擬試穿、藝術和設計的數據生成非常有用。儘管該領域目前受到的關注不算多,但是仍然有研究人員在努力改進現有的方法。


一週AI最火論文 | 100%揭穿偽造人臉圖像,道高一丈反Deep Fake


在這篇論文裡,研究人員提出了一種簡單而有效的方法,這個方法可以自動將服裝圖像的正反面紋理實時轉換成到3D服裝。他們使用的主要方法是,在學習圖像到服裝的UV貼圖的映射時僅僅使用輪廓信息,而無需使用服裝的紋理信息。


研究人員首先介紹了他們使用的參數化3D服裝模型,以及如何用這些模型來規範自動網格到圖像輪廓擬合過程。由於擬合的過程昂貴且容易出錯,因此他們用了有效的神經映射(Pix2Surf),來將圖像紋理實時傳輸到網格上。


他們提出的新模型,Pix2Surf,有著明顯優於2D TPS翹曲等經典方法的性能。因此,這項工作可以說,在將衣服紋理自動轉移到3D服裝的研究領域裡邁出了巨大的一步。它為未來更強大的應用的誕生(例如虛擬試戴)打開了大門,並允許生成學習時所需的具有各種紋理的3D人體模型。


這項技術對於人類的真實感渲染、綜合性數據學習、虛擬試穿、藝術和設計的數據生成非常有用。


https://arxiv.org/abs/2003.02050v1


其他爆款論文


深度學習在自然語言處理方面的進展:

https://arxiv.org/abs/2003.01200v1


簡介:本研究對受益於深度學習的NLP的不同方面和應用進行了分類和處理。它涵蓋了NLP的核心任務和應用程序,並描述了深度學習方法和模型如何推動這些領域的發展。


非Markov任務的交互式機器人培訓:

https://arxiv.org/abs/2003.02232v1


簡介:在論文中,研究員提出了一種貝葉斯交互式機器人訓練框架,該框架允許機器人從老師提供的演示中學習,並讓老師對機器人的任務執行情況進行評估。受不確定性抽樣的啟發,他們還提出了一種新的主動學習方法來識別那些可接受性低的任務。論文證明了,與僅從演示中學習的方法相比,在新框架內進行的主動學習,可以在更大程度上確定教師的預期任務說明。


一個用於自動要素工程和選擇的Python庫:

https://arxiv.org/abs/1901.07329v4


簡介:它提供了一個多步驟的特徵工程和選擇過程:先生成大量的非線性特徵,然後從中選擇一小組健壯的有意義的特徵。這麼做能在提高線性模型的預測精度上,保留其可解釋性。


數據集


用於機器人的大型RGB-D數據集,這個數據集可以用於識別老年人的日常活動:

https://arxiv.org/abs/2003.01920v1


AI大事件


最熱門開發人員職位:

https://www.zdnet.com/article/developer-jobs-these-are-the-coders-who-are-most-in-demand/


計算機科學家防黑客共享密鑰的新武器:

https://www.sciencedaily.com/releases/2020/02/200227072508.htm


數據和人工智能將為沙特阿拉伯經濟帶來超過100億美元的價值:

https://finance.yahoo.com/news/data-ai-add-more-usd-112400061.html


Google DeepMind在COVID-19冠狀病毒研究上的貢獻:

https://www.zdnet.com/article/google-deepminds-effort-on-covid-19-coronavirus-rests-on-the-shoulders-of-giants/


分享到:


相關文章: