如今,人工智能(AI)已經學會了不少遊戲,甚至在一些遊戲裡打敗了人類。遊戲對於AI來說,是非常重要的。它為AI的開發和測試提供了一個相對受限但是安全的環境,因而也成為了測試AI程序的首選平臺。
本文為大家介紹幾款用於測試AI的幾大頂級遊戲,按出現時間從早到晚排列:
西洋雙陸棋
1992年,IBM公司的傑拉爾德·特索羅(Gerald Tesauro)開發了一款名為TD-Gammon的遊戲,這是一個計算機版本的西洋雙陸棋。
這個計算機編程遊戲採用了遊戲專家都不曾瞭解的策略,並使用了名為“時序差分”(Temporal Difference , TD)的學習機制。控制它的算法包括了在神經網絡中對每一步採取權重,可減小前一步的落子與下一步落子位置之間的差異。
國際象棋
1996年,IBM的深藍電腦接連在國際象棋比賽中取勝。同年,它與世界象棋冠軍卡斯帕羅夫進行了比賽,最終卡斯帕羅夫四勝兩平局佔優。1997年,深藍再次向其發出挑戰,卡斯帕羅夫最終落敗。AI邁出了執行智能任務的第一步。
《危險邊緣》
2011年,IBM再次推出了一款具備NLP(自然語言處理)功能的智能電腦,取名為Watson。
在《危險邊緣》中,電腦對陣肯·詹寧斯和布拉德·魯特。電腦需要強大的NLP才能理解遊戲中不太直接的問題。最後電腦贏得了77,147美元,而詹寧斯和魯特分別贏得了24,000美元21,600美元。
在《危險邊緣》接受測試之後,Watson便在醫療保健,天氣預報,網絡安全等許多領域得到了廣泛應用。
圍棋
圍棋是中國最古老也是最複雜的棋盤遊戲。2016年,DeepMind公司的人工智能 AlphaGo和人類之間進行了一場圍棋較量。五場比賽中,AlphaGo成功擊敗了世界冠軍李世石。
在AlphaGo擊敗人類之前,由於涉及複雜的決策,圍棋被認為是AI程序員面臨的首要挑戰之一。人工智能通過強化學習技術,多次自弈學習圍棋。
DeepMind的創始人兼首席執行官丹米斯·哈撒比斯(Demis Hassabis)曾表示,在可用數據更少的情況下,AI也可以自行完成更多的學習,因此除了圍棋,它也適合學習其他各種任務。它還可以幫助優化電網或簡化航運路線,或改進科研工作。
撲克牌
2017年,來自卡內基梅隆大學的幾名學生開發了一款名為Libratus的人工智能,可以與四名玩家在德州撲克中進行對戰,並在為期20天的比賽中擊敗他們。
Libratus還擊敗了頂級撲克玩家如詹森·萊斯(Jason Les)、董·金(Dong Kim)、丹尼爾·麥克奧雷(Daniel McAulay)和吉米·周(Jimmy Chou)。
很明顯,我們無法戰勝這種近乎於納什均衡(編者注:納什均衡是指博弈中這樣的局面,對於每個參與者來說,只要其他人不改變策略,他就無法改善自己的狀況)的策略。在接下來的10天裡,能夠參加比賽並且全力以赴,我們就心滿意足了。詹森·萊斯在接受PokerListings採訪時說道。他說,在比賽進行到一半時,他們就很清楚他們不會贏得比賽。大約一年後,一份研究論文揭示了Libratus是如何編程從而擊敗人類的。就像Alpha Go一樣,它也學會了使用強化學習來學習如何玩遊戲。
比賽之後,Libratus被用於政治談判和拍賣。
編譯組:安心、韋振琛
相關鏈接:
https://www.analyticsindiamag.com/5-games-that-have-helped-ai-become-more-intelligent/
閱讀更多 讀芯術 的文章