人機“心電感應”!人類可以預測神經網絡的錯誤分類

銅靈 發自 凹非寺

量子位 出品 | 公眾號 QbitAI

對抗圖像是神經網絡的頑敵,比如讓AI錯誤檢測路標信息、把烏龜認成步槍,都曾是對抗圖像的“惡搞”。


人機“心電感應”!人類可以預測神經網絡的錯誤分類 | 論文


當千辛萬苦調試的神經網絡遇到了對抗圖像,一場你死我活的尊嚴戰就開始了。

或許,人類可以理解並幫助神經網絡進行判斷。

約翰霍普金斯大學發表的最新論文Humans can decipher adversarial images顯示,人類可以直觀理解神經網絡犯錯的邏輯,並預測機器的錯誤分類。

目前,這篇論文已經被Nature子刊Nature Communications接收。

人機“心電感應”

在這個項目中,研究人員向人類志願者展示了一些對抗性圖片的圖集,讓人類判斷神經網絡會將這些圖片認成什麼。

這個圖集本來是用來檢測機器學習模型用的,裡面的圖像包含了一些微小的、不易被機器察覺的干擾。這48張顯著對抗攻擊產生的圖像,都曾經擊敗過AlexNet和Inception V3等常用圖像識別模型。

人類能猜出來神經網絡是怎麼想的嗎?

這是一項龐大的工程,研究人員找來了1800名人類志願者參與這個項目。他們將志願者分成了8組,包括7個200名志願者組成的組和1個400名志願者組成的組,共進行7組實驗。

為了保證參與者之間的多樣性,每一組志願者分別負責一組實驗。

實驗開始前,研究人員怎麼也沒料到,人類的直覺與神經網絡的選擇竟然可以這麼相似。

實驗開始

第一關,用多餘的圖像標籤迷惑神經網絡

研究人員讓人類依次識別48張圖像,每一張圖像給出兩個標籤,一個是機器為該圖像選擇的,另一個是從其他47張圖像中隨機抽取的。人類需要猜測,到底哪一個才是機器給出的標籤。


人機“心電感應”!人類可以預測神經網絡的錯誤分類 | 論文


結果發現,人類選擇的圖片標籤中有74%與機器選擇的標籤一致,98%的人更傾向於選擇與機器相同的標籤,遠高於50%隨機選擇概率。初步實驗表明,人類的選擇與機器有著驚人的普遍性

人類與機器的思維有多相似?研究人員繼續進行了下一場實驗。

第二關,找出機器的首選與次選

在這場實驗中,研究人員要求人類為每張圖像排序。他們用AlexNet模型給每張圖像的首選標籤和次選標籤給人類,讓人類猜測哪些是神經網絡的首選。


人機“心電感應”!人類可以預測神經網絡的錯誤分類 | 論文


結果依舊證明了實驗一的結論,91%的選擇與機器的首選一致,人類似乎真的能猜透神經網絡的心。

研究人員加大難度,繼續進行了第三場實驗,多向分類

這一次,人類志願者需要處理的標籤數量一下子從2個增加到48個:研究人員給定一張圖片,讓人類在48個可能的標籤中挑選最符合圖片內容的標籤。

人類的判斷與機器分類再一次重合,90%的人類與機器的首選一致。這些結果表明,人類與機器的錯誤分類具有一致性。

研究還在繼續,難度仍在加大。

第四場實驗看起來似乎有些“玄學”,判斷雪花狀電視圖像中是什麼

比如下圖這些類似電視沒信號時出現雪花點:


人機“心電感應”!人類可以預測神經網絡的錯誤分類 | 論文


你能猜出哪張裡面包含一隻知更鳥麼?


人機“心電感應”!人類可以預測神經網絡的錯誤分類 | 論文


這些圖像看起來只是色彩塊的集合,讓人摸不到什麼規律。仔細看會發現,每張圖中央都會有一塊色彩密集的區域,但是也看不出是什麼。


人機“心電感應”!人類可以預測神經網絡的錯誤分類 | 論文


但是,依然有80%的人類志願者與機器達成一致。並且,人類為75%的圖像選擇的首選標籤也是機器的首選圖像。

此外,研究人員還進行了數字干擾實驗、自然圖像和局部擾動實驗、3D物體實驗。


人機“心電感應”!人類可以預測神經網絡的錯誤分類 | 論文


7組實驗下來,研究人員斷定:人類的思維直覺與機器的相似性極高,因此人類可以預測機器會不會進行錯誤分類,進而預測、修正機器的判斷邏輯。

黑盒,看起來也沒有那麼不可捉摸了。

傳送門

論文Humans can decipher adversarial images地址:

https://www.nature.com/articles/s41467-019-08931-6#Sec1

VentureBeat報道:

https://venturebeat.com/2019/03/23/humans-can-predict-how-machines-misclassify-adversarial-images/

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態


分享到:


相關文章: