從此再無真「相」!這些人全部是AI生成的

英偉達研究人員推出的人工智能算法 StyleGAN 可以合成足以騙過人類的假人臉。不過對於大多數人來說,這項基於生成對抗網絡(GAN)的技術距離我們還很遙遠。這個問題很快就被一名 Uber 工程師解決了,近日,一個名為「此人不存在」的網站悄然上線。

網站鏈接:https://thispersondoesnotexist.com/

從此再無真「相」!這些人全部是AI生成的

雖然「他們」看起來都沒有什麼奇怪之處,但這就是問題所在:這些人都不存在。圖片來自 ThisPersonDoesNotExist.com 網站。

AI 產生虛假視覺效果的能力目前似乎還不是主流,但這個網站的出現讓「有圖有真相」變成了過去式。結合昨天 OpenAI 提出的通用語言模型 GPT-2,我們或許可以製造一個完全虛假的記者,報道虛假的新聞,然後騙過所有人。

ThisPersonDoesNotExist 網站的創建者是 Philip Wang,他是一位來自 Uber 的軟件工程師。他利用英偉達去年發佈的研究成果創作了源源不斷的假人像。其背後的算法是在一個巨大的真實圖像數據集上訓練的,然後用 GAN 來生成新的例子,即假臉。

「每次你刷新這個網站,網絡就會從頭開始生成新的人臉圖像。」Philip Wang 在其 Facebook 中寫道。他在 Motherboard 上的一份聲明中補充道:「很多人都不知道未來 AI 合成圖像的能力到底有多強。」

從此再無真「相」!這些人全部是AI生成的

你能看出「她」其實是假的嗎?

SyleGAN

支持該網站的基本 AI 框架是著名的生成對抗網絡 GAN,最初是由谷歌大腦科學家 Ian Goodfellow 等人在 2014 年發明的。英偉達採用的 StyleGAN 最近已經開源,並被證明非常靈活。

StyleGAN 官方開源地址:https://github.com/NVlabs/stylegan

雖然當前版本的模型是被訓練用來生成人臉圖像的,但理論上來說它可以模仿任何來源的圖像。研究人員已經在嘗試其它目標:有人用它來生成新字體,有人用它來製造二次元老婆,當然用 StlyeGAN 來吸電子貓的也大有人在。

在默認情況下,SyleGAN 訓練 1024×1024 分辨率的圖片需要使用 8 塊 GPU 訓練接近一個星期,研究人員在說明文檔中勸告所有使用者:使用較少 GPU 可能無法達到最佳效果。他們還列出了使用英偉達 Tesla V100 GPU 對不同分辨率的圖像進行訓練所需的時間以供參考。

從此再無真「相」!這些人全部是AI生成的

這麼高的硬件需求看起來令人望而卻步,卻並沒有擋住眾多技術人員的好奇心,這個 GitHub 很快就收穫了 2600 多個 star,越來越多的 AI 作品也出現在社交網絡上。

從此再無真「相」!這些人全部是AI生成的

很多用戶在使用二次元妹子頭像訓練 StlyeGAN,從而生成大量此前從未出現的動漫形象。

具體來說,如果使用包含 300 餘萬張圖片、9000 萬標籤的動漫圖像數據集 Danbooru2018 進行訓練的話,數據集是這樣:

從此再無真「相」!這些人全部是AI生成的

訓練結果:

從此再無真「相」!這些人全部是AI生成的

由於 Danbooru2018 數據集中作品的畫風並不一致,人工智能這回生成的圖像好像有一點詭異的藝術感……

影響

在技術人員的狂歡之下,人工智能的強大「造假」能力也引發了一些人的擔憂。正如之前在 The Verge 中討論的一樣,像 StyleGAN 這樣的算法非常強大,給人們帶來了很多想象空間。一方面,這項技術會帶來明顯的創造性應用。像這樣的程序可以創造無盡的虛擬世界,也可以幫助設計者和插畫師。它們已經開發出了新的藝術品,比如去年的「天價」AI 畫作事件:去年 11 月,佳士得拍賣行以 43.25 萬美元(約 300 萬人民幣)的高價拍出一件人工智能藝術品。

從此再無真「相」!這些人全部是AI生成的

Belamy 系列畫作是對 GAN 算法開發鼻祖 Ian Goodfellow 的致敬,「bel ami」在法語中的意思即為「Good fellow」——好朋友。其作者是幾位沒有接受過藝術訓練的 25 歲年輕人。

但這種技術也會帶來一些隱患。正如我們在關於 deepfakes(該網站利用 GAN 將人們的臉粘貼到目標視頻上,主要目的為了製作非自願的色情製品)的討論中所看到的,大規模操縱和生成現實圖像的能力將對現代社會如何看待證據和信任產生巨大影響。這類軟件對於政治宣傳和影響運動也非常有用。

換句話說,ThisPersonDoesNotExist.com 只是對 AI 技術的一種禮貌性介紹。人們對於風險意識的建立恐怕還要慢慢形成。目前,Philip Wang 的網站使用雲服務器上的 GPU 進行計算,「它每兩秒鐘『想象』出一張人臉,並以可擴展的方式向全世界展示。」Philip Wang 表示。「這並不花哨。」


分享到:


相關文章: