跟特朗普、愛因斯坦 Zoom 連線什麼感覺?實時換臉一張照片搞定

來源:智東西

編 | 雲鵬

俄羅斯的兩位研究員推出了一款名為 Avatarify 的軟件,可以與 Zoom 或 Skype 等視頻會議軟件配合使用,將視頻會議中用戶的面容變成任意指定名人的樣子。這也意味著 " 實時 Deepfake" 這種 AI 功能開始走入普通用戶的生活中。

通常 Deepfake 的訓練和推理速度相對較慢,大多用在視頻製作中,而不能滿足實時視頻通話的需求。Avatarify 的出現顯著縮短了 Deepfake 的延遲,並提升了速度,而且只需要一張指定圖片就可以完成替換。

據瞭解,Avatarify 所使用的 AI,採用的是目前已經開源的 AI 算法,基於 First Order Motion 核心模型,該 AI 已經在包含超過一萬兩千個人臉的視頻數據集中進行了訓練。不過目前 Avatarify 的實時 Deepfake 功能還處於初級階段,而其存在的安全隱患也有待進一步討論。

跟特朗普、愛因斯坦 Zoom 連線什麼感覺?實時換臉一張照片搞定

一、想變誰就變誰,只需一張圖片

疫情之下,在線視頻會議已經成為常態,而居家辦公往往會遇到尷尬的背景,因此 " 自定義會議背景 " 的功能已經比較常見。現在,這一功能的 AI 能力再次升級,通過對實時畫面的重構,AI 可以將你的臉變成各種名人的樣貌。

也就是說,人人可用的實時 Deepfake 來了。

跟特朗普、愛因斯坦 Zoom 連線什麼感覺?實時換臉一張照片搞定
跟特朗普、愛因斯坦 Zoom 連線什麼感覺?實時換臉一張照片搞定

俄羅斯 Skolkovo 科技學院的 Karim Iskakov 和程序員 Ali Aliev 共同開發了一個程序,可以讓你在視頻通話期間實時改變你的面容。據瞭解,Karim Iskakov 也是三星 AI 研發中心的研究人員,不過他這次特意強調到,Avatarify 這個項目跟三星沒有任何關係。

這兩位程序員在去年一年中,分別在 Github 上貢獻了一百多項開源代碼。

左:Ali Aliev,右:Karim Iskakov

這次的焦點就是一款名為 Avatarify 的軟件,它可以搭配 Zoom 或 Skype 這類主流視頻會議應用程序使用,而它所需要的素材只有一張名人頭像圖片。

該軟件可以瞬間將一個人的面部表情及其面部特徵投射到一副圖片上,例如名人或藝術品的照片,比如《蒙娜麗莎的微笑》。

跟特朗普、愛因斯坦 Zoom 連線什麼感覺?實時換臉一張照片搞定

不過目前這一功能還處於初級階段,如果用戶在視頻中大幅度地移動頭部,特別是在背景非常複雜的場景下,這種實時 Deepfake 就會明顯失真。

目前該軟件在 Github 上的收藏數量已經達到 4.4 萬,登上了 Github 的熱榜,相關議題討論數量為 69 個,集中於軟件所需運行環境和一些小 BUG 的討論。

跟特朗普、愛因斯坦 Zoom 連線什麼感覺?實時換臉一張照片搞定

二、將動畫視頻 AI 算法搬到生活中

據瞭解,該軟件使用的是目前已有的開源 AI 算法,現在這些算法通常被用於動畫視頻的製作。除此之外,該 AI 已經在包含 12331 個人臉的短視頻數據集中進行了訓練,這些視頻來自 YouTube 上的各類新聞採訪。

Avatarify 所使用的算法基於名為 First Order Motion 的核心模型,這個模型可以對視頻中的對象進行動畫處理,並生成視頻序列。最重要的是,這個模型所需要的視頻不需要做任何註釋,也不需要提前輸入特定對象的先驗信息。

跟特朗普、愛因斯坦 Zoom 連線什麼感覺?實時換臉一張照片搞定

First Order Motion 模型運作流程

該模型分為運動估計模塊和圖像生成模塊兩個主要組成部分。

根據論文所述,在運動估計模塊中,該模型通過自監督學習將目標物體的外觀和運動信息進行分離,並進行特徵表示。

而在圖像生成模塊中,模型會對目標運動期間出現的遮擋進行建模,然後從給定的名人圖片中提取外觀信息,結合先前獲得的特徵表示,進行視頻合成。

跟特朗普、愛因斯坦 Zoom 連線什麼感覺?實時換臉一張照片搞定

這個模型可以輕易地讓權利遊戲中的人物模仿特朗普進行講話,還可以讓靜態的馬跑起來,另外還可以完成模特的 " 一鍵換裝 ",這對於美工來說或許是一個福音。

不過能夠良好的實現這一效果,也需要一定硬件的支持,如果想實現 33 幀 / 秒的視頻效果,需要一張 1080ti 顯卡,什麼概念呢,就是英偉達10 系顯卡中的卡皇。

如果使用 Macbook,幀數可能會低至 1 幀 / 秒左右。

三、Deepfake 安全問題變得更加棘手

從 2017 年 Deepfake 出現以來,其安全隱患就一直受到各國政府和安全機構的重視。比如用明星面孔偽造色情片、利用換臉視頻影響政治大選,都是比較典型且嚴重的安全事件。

目前,針對 Deepfake,谷歌、微軟、Facebook等眾多科技巨頭都在開發各種檢測技術。但目前比較進階的 Deepfake 仍然可以騙過大多數 AI 檢測模型。

如今,Avatarify 的出現無疑又給 Deepfake 的鑑別帶來了更大的困難,實時的圖像偽造已經成為可能!

不過,技術永遠是把雙刃劍,相關法規制度的出臺、合理的監管以及消費者素質的提升才是根本。就像谷歌的科學家 Nick Dufour 和相關技術研究經理 Andrew Gully 在文章中寫道的:" 雖然一些人認為這只是個娛樂工具,但還是有很多人認為它可能危害社會。"

現在 Zoom 或 Skype 並未因安全隱患對此功能進行封鎖,Avatarify 仍可以正常配合這兩款軟件進行使用。


分享到:


相關文章: