這年頭,你連吵架都吵不過AI了……

這年頭,你連吵架都吵不過AI了……

還覺得AI們都是小智障嗎?

這年頭,你連吵架都吵不過AI了……

其實,在我們不知道的時候,AI們已經能夠進行辯論了。

近日,在OpenAI發佈的一篇文章中,簡述了一項新的人工智能安全技術,從而成功引起了人們的注意。文章顯示,通過搭建人工智能辯論框架,AI們能夠在人工的引導下幫助彼此矯正自身問題,從而使多個AI的執行結果統一且符合人類價值體系,以此保證系統的安全。

研發人員表示,這一辯論框架的功能還不止於此。基於複雜計算進行的推測,加上不受思想維度限制的辯論,這樣的方法將有可能訓練AI系統執行超過人類認知能力的任務。屆時,不管道德矛盾還是倫理困境,唯心主義還是唯物主義,很多問題都將得到解決。

這年頭,你連吵架都吵不過AI了……

這年頭,你連吵架都吵不過AI了……

辯論有何用?

隨著AI算法結構趨於複雜,人類對於AI的評估及訓練也充滿了更多的不確定因素。

目前現有的強化學習,依靠的是預先設定好的獎懲參數,這需要人類在訓練之前便羅列出能夠獲得獎勵信號的行為及輸出結果。實際上,這種看似不錯的思路,卻令強化學習處處掣肘。

正如AlphaGo在博弈中的情況,研發人員其實很難評判其每一次落棋好壞。如果要按照一般訓練邏輯強行對其所決定的每一步進行引導,AlphaGo的棋技無疑會受到限制。

這年頭,你連吵架都吵不過AI了……

但若有了AI辯論模型,就如同這場棋盤上的廝殺有了解說,在兩方的爭論之中,研發人員自然而然便能夠知道,從哪一步開始AI們有了分歧,又從哪一步,某個AI走向了錯誤的終點。

AI辯論的實質,是雙AI的同步訓練。他們將在強化學習中被輸入相同的問題。如若兩者得出的結論不同,則讓彼此指出對方決策過程中存在的缺陷。這樣一來,即使智能體對問題有比人類更深層次的理解,人類也可以去判斷哪個智能體更好地反駁了對手。

更直觀地說,若我們提問AI一號:“哪裡是度假的最佳去處?”即使AI一號告訴我們是“阿拉斯加”,我們也很難判斷這一“最佳”是否名副其實。但如果AI二號說:“不,應該是巴厘島。”人們自然可以對比兩者的優缺點,並得出巴厘島休閒又暖和,是冬季裡更好的去處這一結論。

並且,在兩者的辯論中,研發人員還能通過AI一號提出的諸如“護照來不及辦了”“遊客太多”等反駁中,進一步瞭解AI一號之所以不推薦巴厘島的考量,以及辯論雙方在推理中存在的漏洞。

這年頭,你連吵架都吵不過AI了……

辯論如何實現?

AI辯論框架的靈感來源,正是對於圍棋博弈的評估。只不過,評估的對象從走子換成了辯論的句子。在評估中,只有當最終結果出現時,研發人員才會對AI進行評價。

這年頭,你連吵架都吵不過AI了……

當然,研發人員並不只是在最終評價中扮演角色。如在“最佳度假地點”的辯論中,為了得到辯論的最終結果,他們將會根據辯論進展在“阿拉斯加”與“巴厘島”中作出選擇,直到一方的智能體知道再辯論下去也無法再改變人類的決定為止。

不過目前,由於對自然語言建模的研究還處於較為初級的階段,研發人員在辯論模型中並沒有選擇用其作為辯論AI用於對抗的主要工具,而是運用可視化的方式更為直觀地展示AI們的邏輯。

在辯論中,智能體將會被輸入完整且相同的圖像,而測試中評價者將通過AI們篩選出的像素點,猜測完整圖像的內容。

這年頭,你連吵架都吵不過AI了……

正如在貓狗辯論中,AI一號將會誠實地表明照片內容是一隻狗,而AI二號則需要讓人們相信圖片中的動物是貓。

由於它們每次只能向研發人員展示固定單位的像素,AI一號為了讓人們能夠很快地知道狗才是這道選擇題的正確答案,便很有可能提供給研發人員一個帶有綠色、黑色、黃色的像素塊,並告訴人們“這是一隻狗的耳朵,狗正在草地上”。而AI二號為了反駁一號,則會將這一像素塊描述成“貓的頭頂”“貓的屁股”等與狗耳具有相似弧度的部位。

這年頭,你連吵架都吵不過AI了……

讀芯君開扒

AI辯論,雞肋還是靈丹妙藥?

辯論模式其實已經不是新鮮事,在AlphaGo 和其他遊戲AI的實踐中,該框架已經取得了一定的認可度。但其本身所具有的侷限性,是該方法一直未被廣泛應用於強化學習的根本原因。

首先,由於參與訓練的AI均需要具備參與辯論的基礎,這給圖片識別技術、語義識別技術都帶來了極大的挑戰。也就是說在現階段AI的發展基礎上,AI辯論只能實現簡單的錯誤糾正,而無法完成絕大多數等同於人類認知的任務。

其次,由於人工的廣泛介入,以及將人類意見作為評判結果的唯一標準,人類的偏見、侷限也將成為AI的一部分,從而限制AI辯論的維度拓展。

這年頭,你連吵架都吵不過AI了……

參考文獻鏈接:

https://www.leiphone.com/news/201805/teesfrjv5XGzvrfR.html?viewType=weixin


分享到:


相關文章: