AI讓我開始質疑「看到」的一切科技頭條網

2018-12-17 15:56:46 奇點壯士

過去我們常說：「耳聽為虛，眼見為實」。這句話在今天可以說已經「正式」不適用了。我們也有權懷疑一切在互聯網上「看」到的東西，因為不管是圖片還是視頻都完全有可能的「假」的，都有可能是人工智能的傑作。

最近，NVIDIA公司利用生成對抗網絡(Generative Adversarial Network，GAN)技術生成了一些人臉圖像。這些圖像顯然可以用「極度逼真」來形容，其真實度相信完全可以騙過你我的眼睛。仔細看下下面這些「人臉」，每一張臉是「假」的，即沒有真實人物原型，完全由AI自主生成。

作為一種神經網絡技術，GAN可以基於對真實照片的學習迭代地生成圖像。然後它會根據原始的真實圖像評估新生成的圖像。這時研究人員會結合不同類型的人臉（比如老年人、年輕人、戴眼睛或不同髮型等）教給GAN一些不同的人臉「風格」。

最終生成的結果只能說令人驚歎。像雀斑、皮膚毛孔、胡茬這樣的小細節也看起來非常自然逼真。

除了生成人臉，GAN也隨即生成了一些貓臉，但效果同人臉相比並不是非常理想。

其實在去年，NVIDIA就利用GAN生成了幾組人臉圖像，但當時的圖像效果並不好。我們可以看到下面這些人臉看起來有些扭曲、生硬，分辨率也低很多。

除了偽造圖像，偽造視頻的技術—「Deepfakes」正在走向成熟。所謂的「Deepfake」是「deep learning」(深度學習)與「fake」(偽造)的合成詞，指專門利用基於人工智能的人體圖像合成技術，生成偽造的視頻影像。這項技術可以將已有的圖像和影像合成至目標圖像或影像上，比如將某個明星或公眾人物的臉合拼接到一個已有的視頻上，效果就是這個明星做了一些自己並未做過的事。

2017年年底，一個Reddit用戶利用Deepfake技術將一些好萊塢女星合成到標記為「限制級」的小視頻裡，併發布到網上。為了合成視頻，這個用戶首先下載了數千條女星們的視頻，並基於這些數據訓練AI算法，最終較自然地將色情女演員的臉替換成好萊塢女星的臉。

現在主流的Deepfake技術雖然已能達到以假亂真的地步，但仍存一些限制。比如你想偽造一個你打網球的視頻，將你的面部結合到一位專業網球選手的身體上，以顯示你的網球水平有多專業。

按照主流的Deepfake技術，你的臉雖然可以被拼接到網球選手身上，但你始終會被限制在網球選手視頻原有的動作中。也就是說，你的動作始終被網球選手的動作所「驅動」，你的臉只不過是「騎在」他的身體上。

而今年9月份，來自海德堡大學的一個研究團隊在European Conference on Computer Vision（歐洲計算機視覺會議）中演示了一種新的Deepfake算法，能使我們突破這個限制。這個報告被髮布在Github裡，報告標題為：「Towards Learning a Realistic Rendering of Human Behavior」。有興趣的小夥伴可以找來看看。

這種新算法可以通過檢查你現有的形象，學習你的樣子，然後將你的整個形象（包括面部、服飾等）映射到網球選手的影片裡。最關鍵的是，研究人員可以讓你在一個虛擬環境中隨意走動，隨意移動你的胳膊和腿，也就是說你的動作將不再受到原影片的限制。有了這種技術，你就可以在視頻裡隨意展現你高超的網球技術、武術動作，每天做100個引體向上和俯臥撐也不是問題。