IBM AI再戰人類辯手,輸了!覆盤全程精彩

智東西(公眾號:zhidxcom)文 | 心緣

美國舊金山當地時間2月11日,曾在去年6月完勝以色列辯論冠軍的AI辯手——IBM Project Debater重出江湖,對戰2016年世界辯論決賽選手、畢業於牛津大學的Harish Natarajan。

本次比賽在位於舊金山的IBM Think會議上舉行。雙方圍繞“政府是否應該資助學前教育(Whether goverment should subsidize pre-schools?)”進行激烈交鋒。

從AlphaGo接連戰勝國際圍棋冠軍,到AlphaStar在星際爭霸2將人類對手殺得片甲不留,AI一直在挑戰新的高峰,不斷刷新戰勝人類的歷史記錄。

可惜這一次,AI落敗。

不過,如果你以為這個AI系統只是個辯論機器,或者只是個幫助人類補充邏輯思維的工具,那你就有點天真了。這只是IBM宏偉野心剛剛拉開的序幕。

IBM AI再戰人類辯手,輸了!覆盤全程精彩

▲人類冠軍辯手Harish Natarajan與IBM Project Debater進行辯論

IBM AI再戰人類辯手,輸了!覆盤全程精彩

人類首次辯贏AI

這場辯論採用傳統美式辯論規則:雙方在開場15分鐘前得知辯題,辯論分為三回合,前兩回合每人4分鐘,第三回合2分鐘結辯陳詞。

最終結果由現場800位觀眾投票決定。在開場時,觀眾會根據辯題進行第一輪的投票,然後在辯論結束時再次投票,哪一方的跑票數更少,哪一方就是冠軍。

這種投票方式可以避免辯題本身對觀眾產生的傾向性,使得辯論勝負的判斷更為公正。

本輪辯論,IBM的AI系統Project Debater為正方,人類辯手Natarajan站反方。在辯論前的投票中,79%的觀眾同意政府應資助學前教育,即Project Debater所在的正方的觀點,13%的觀眾選擇了不同意。

Natarajan擁有大多數辯論賽冠軍的世界紀錄,參加過三次世界錦標賽,並在2012年贏得了歐洲錦標賽冠軍。在得知辯題後,Natarajan快速將思考潦草地記在紙上。

IBM的研究人員們就像看自己的孩子參加演出一樣,在臺下時而大笑時而緊張。

IBM AI再戰人類辯手,輸了!覆盤全程精彩

▲IBM Project Debater

在打比賽之前,Project Debater完全不知道辯題,但它展示出即時且富有邏輯的語言組織能力。

作為辯題的正方,Project Debater主要圍繞資助學前教育對社會的意義展開論證,具體觀點包括可使貧困人口受益,讓學生獲得成功、促進整體教育、提升社會公平、以及降低犯罪率。

Project Debater在論證時多旁徵博引,從離線數據庫、語料庫中調用廣泛的資料來源,其中包括國家早期教育研究所和疾病控制與預防中心。

但令人感到稍有遺憾的是,在駁辯(Rebuttal)環節,Project Debater未能突破既有立論觀點,除了更多地鋪陳外,並未作出有力的反擊。

與此同時,人類辯手Natarajan卻表現地相當精彩,他認為學前補貼可以在其他地方更好地用於幫助處境最不利的人,並連續拋出“基於市場現實,補貼將消耗中產家庭的財政資源”、“資助學前教育並不意味著讓所有孩子都上學”等富有說服力的論證。

最終投票結果是,62%的觀眾支持正方,30% 的觀眾支持反方,因為反方的跑票數更少,Natarajan為人類摘下了辯論界人機大戰第二戰的桂冠。

IBM AI再戰人類辯手,輸了!覆盤全程精彩

雖敗猶榮,AI背後的技術不容小覷

儘管Project Debater輸了,它的表現依然令人印象深刻。

在圓桌環節,Natarajan如是評價這一強大的AI系統:“她能有效理解信息,能通過從後臺數據庫中提取研究材料,將這些信息快速整合,並流暢地表達出來,如果將這樣的技能與人類技能相結合,將會有效地提升決策力。”

IBM AI再戰人類辯手,輸了!覆盤全程精彩

▲從左到右:IBM Research的Project Debater首席研究員Noam Slonim,IBM Project Debater,IBM Project Debater項目經理Ranit Aharonov,人類辯手Harish Natarajan

這個攪動辯論界風雲的Project Debater由IBM Research所研製,它是一個具有幽默感、小巧機智和偶爾有強有力的論點的實驗性會話AI系統,也是第一個可以對複雜話題進行辯論的AI系統。

要知道,讓機器辯駁人類邏輯絕非一件易事。

和擁有預先定義規則的棋盤遊戲截然不同,AI辯手必須適應人的理性和思考邏輯,並提出人們可以理解和接受的論點。

它除了要具備從海量凌亂的非結構化人類語言數據庫中檢索並提取所需知識的能力外,還要具備堅持自己論點、快速組織邏輯結構、避開語法錯誤以及預測和反駁對手論點的能力。

美國時間2018年6月18日,Project Debater首度亮相,並在和人類的首場大戰中告捷。Project Debater與2016年的以色列國家辯論冠軍Noa Ovadia、以色列國際辯論協會主席Dan Zafrir分別以太空和醫療辯題進行了辯論。()

IBM AI再戰人類辯手,輸了!覆盤全程精彩

▲從左到右:IBM Project Debater,以色列國家辯論冠軍Noa Ovadia,以色列國際辯論協會主席Dan Zafrir

當時IBM Research首席調查員兼Project Debater的創造者Noam Slonim稱,這一AI系統的訓練早在六年前就開始,直到兩年前才有能力參與與人們的辯論。

Project Debater擁有數以億計的論文、報告和新聞文章的龐大數據庫。通過消化這些數據,Project Debater可以就特定主題做出邏輯結構良好的演講,提出清晰明確的論點,並對對手觀點進行反駁。

過去六年來,IBM以色列海法實驗室領導的全球IBM研究團隊研究了數十篇研究論文中記載的許多創新技術,最終賦予了Project Debater三種功能,每種功能都在AI方面開闢了新的天地:

1、數據驅動的語音編寫和交付功能;

2、聽力理解能夠識別隱藏在人類連續冗長的自然語音中的關鍵主張,並構建有意義的反駁;

3、系統的模擬人類困境,基於一個獨特的知識圖譜,提煉出原則性的論點。

最終,當Project Debater站上辯論場,它已經是一臺擁有淵博知識和超強邏輯的頗為“成熟”的辯論機器。

IBM研究項目Debade首席研究員Noam Slonim表示,自去年6月以來,他們一直在努力改進系統,Project Debater的數據來源已經擴充到2018年年底的數據。

當然,在和人類交鋒時,Project Debater也露出了一些破綻。

比如8個月前和人類的首場辯論賽中,Project Debater當時出現些許不是很自然的敘述以及誇張過激的言論。再比如在本場辯論賽中,“進化”過的AI系統在駁辯環節困守於固有觀點,沒有做出新的突破。這些問題都需要研究人員持續研究和改進。

IBM AI再戰人類辯手,輸了!覆盤全程精彩

IBM的星辰大海:“無偏見”的辯論機器

IBM(國際商業機器公司)這位年逾百歲的藍色巨人,不僅堪稱科技界的教父級公司,更是AI系統的開山鼻祖。

1962年,IBM展示了全球第一個語音識別設備Shoebox。

1997年,IBM的深藍系統vs國際象棋世界冠軍卡斯帕羅夫,是世界上最早以機器勝利告終的人機大戰,比擊敗柯潔的AlphaGo還早了19年。

2001年,IBM的沃森系統在在美國老牌智力問答節目《危險邊緣(Jeopardy!)》打敗了最高獎金得主布拉德·魯特爾和74場連勝記錄保持者肯·詹寧斯,贏得100萬美元獎金。

而Project Debater出生的使命,也不只是為了和人類打辯論賽。

根據IBM研究人員Noam Slonim和Ranit Aharonov的說法,辯論只是對該技術的有趣展示方式,而Project Debater真正力的量將是其展現無偏見論述的能力。

語言充滿了魅力,亦處處是陷阱,當人類被情感和偏見左右,看問題的角度很難做到完全的真實與客觀。

IBM希望做到的,是在充滿錯漏和片面信息的時代,通過推動AI在語言和推理的進步,幫助人們建立充分知情的論點,產生更為公正的結論,並做出更好的決策。

當然,這一目標的實現過程充滿荊棘。數據庫本身就是個難題,Project Debater所使用的原始數據來自人類的作品,這些數據仍然會包含作者的情感和偏見。

IBM研究人員Noam Slonim曾透露他們解決偏見問題的做法。他們為AI系統設置了一個置信度閾值,如果AI對其論述感到自信,它會創建一個更復雜的陳述;如果感覺不那麼自信,那麼陳述就會相對簡單。

IBM AI再戰人類辯手,輸了!覆盤全程精彩

結語:AI踏上新的征程

這場辯論賽,AI輸了,這說明在語言和推理領域,人類依然保有優勢,而AI還沒有真正地準備好。

雖然AI尚且並不能完全和人類相提並論,但從Project Debater的表現來看,我們正在見證互動性AI系統的持續演進。

毫無疑問,在快速地成長中,這一變革性的AI系統將以更敏銳的反應速度給出流暢的思辨,並將提出更加貼近公正事實的觀點。

正如IBM研究主管Dario Gil所言,Project Debater存在的目的不是為了擊敗人類,而是探究如何通過

信息交換和有效交流實現人機合作,提升決策效率和科學性,真正推動AI系統的疆界,更好地理解人類。

AI和人類,誰輸誰贏其實並沒有那麼重要。AI背後的技術以及如何幫助人類做出更加明智的決定,這些才是我們應當關注的焦點。


分享到:


相關文章: