Deepfake新技術:用你的臉和你的嘴巴,說你沒說過的話

你可能會看到這麼兩段視頻:第一段裡,一個女人看著鏡頭說:“知識是一回事,美德是另一回事。”第二段裡,同樣是這個女人,卻說了截然相反的一個觀點:“知識就是美德。”這兩段視頻中,只有第一個是真實的,第二個完全是deepfake人工智能的虛構作品。

來自新加坡南洋理工大學、中國模式識別國家實驗室和人工智能軟件公司SenseTime的研究人員最近開發出了通過音頻文件製作deepfake假視頻的方法。只要能得到一段某人的聲音片段,研究人員就能把這個聲音嫁接到其他任何話上——視頻中的人就這麼變成了原始聲音的傀儡。

Deepfake新技術:用你的臉和你的嘴巴,說你沒說過的話

為了達成逼真效果,研究人員首先在目標視頻的每一幀上創建一個三維人臉模型,以提取面部結構和表情。他們可以由此畫出臉部的二維特徵,尤其是嘴部的動作。然後,他們重建一個三維人臉網格,以匹配原始音頻的嘴唇運動。這樣,一個以假亂真的說話視頻得以生成。

Deepfake新技術:用你的臉和你的嘴巴,說你沒說過的話

這種方法可以使用任何人的真實聲音,並將他們的話拼接成任何語句,這可以說是“deepfake現實主義”的又一個飛躍。研究人員也在這篇新論文中點明瞭這種新技術可能帶來的風險。“我們確實承認,這種前瞻性技術有可能被濫用於各種惡意用途,包括媒體惡意操縱宣傳。因此,我們堅決支持一切防範此類濫用行為的措施……我們將齊心協力,在不損害公眾切身利益的情況下,推廣尖端創新技術。”


分享到:


相關文章: