繼圍棋輸給AI之後,麻將又要被人工智能征服

今天聊一件挺有意思的事情:打麻將。

繼圍棋輸給AI之後,麻將又要被人工智能征服

近日,微軟發佈了一份關於麻將AI(人工智能)“Suphx(意為Super Phoenix,超級鳳凰)”的修訂版預印本文件,正式公佈Suphx是一個專業十段水平的“選手”,超越了99%人類玩家,這是計算機程序首次超過麻將中大多數頂級人類玩家。

微軟的“超級鳳凰”是在日本在線麻將競技平臺“天鳳”進行測試的。

Tenhou(天鳳),因其完善的競技規則、專業的段位體系,成為了業界知名的高水平專業麻將平臺,受到職業麻將界的廣泛承認。天鳳擁有全球近 35 萬名活躍麻將愛好者,其中不乏大量的專業麻將選手。

據這份公開資料顯示,“超級鳳凰”去年3月登陸天鳳,與人類選手展開了5000餘場四人麻將對局,幾個月內就達到了十段,這是目前為止,世界上第一個也是唯一一個達到10段水平的人工智能。天鳳平臺自2006年推出以來,四人麻將達到過十段的選手約有180位,而現役的十段人類選手也不過十幾位。微軟說“超級鳳凰”超越了99%的人類玩家絲毫不誇張。

繼圍棋輸給AI之後,麻將又要被人工智能征服

suphx在天鳳平臺上對戰

麻將是起源於我國的大眾娛樂項目,今天我們熟知的麻將玩法大體成型於晚清,在當時稱作“麻雀”。隨著商貿與外交活動的開展,麻將漸漸風行亞洲,乃至流傳到世界各地。如今,僅在亞洲地區就擁有1億多名麻將玩家。無論是逢年過節的熱鬧團聚,還是茶餘飯後的日常小聚,四個人、一桌牌,就能打個熱火朝天。

麻將不僅是娛樂項目,還是正式的體育運動項目。國際智力運動聯盟在 2017 年宣佈,競技麻將成為繼圍棋、象棋、國際象棋、橋牌和國際跳棋之後的第六項國際正式智力運動項目。

繼圍棋輸給AI之後,麻將又要被人工智能征服

近年來,隨著人工智能在象棋、圍棋、德州撲克等眾多棋牌類遊戲中獲得亮眼的成績,AI 在麻將領域卻一直有待跨越性的突破。

與只有 52 張牌的德州撲克相比,136 張麻將牌的排列組合可能性更多。麻將四人同場,一個玩家兩次出牌之間,可能出現的不同局面數目非常巨大。而且4 位玩家的出牌順序是不固定的,任意一位玩家的“吃碰槓”都可能使出牌順序突然改變。

與象棋和圍棋相比,麻將則存在大量的隱藏信息。象棋和圍棋玩家可以看到棋局中對方玩家的落子。麻將中每個玩家可以有 13 張手牌,另外還有 84 張底牌。對於一個玩家而言,最多可以有超過 120 張未知的牌。

面對麻將這樣存在高度不確定性的遊戲對弈,研究員們開發了丟牌模型、立直模型、吃牌模型、碰牌模型以及槓牌模型等5大模型,專門訓練“超級鳳凰”的打牌策略。甚至,“超級鳳凰”還有一個基於規則的贏牌模型,決定在可以贏牌的時候要不要贏牌。

針對麻將中存在的豐富的隱藏信息,研發團隊研發了一個“先知”教練,這個“先知”可以看到包括玩家、對家、公共信息等所有的信息,在對“超級鳳凰”進行強化學習訓練後,研究人員會逐步控制“先知”,逐漸使“先知”最終過渡到正常AI,“超級鳳凰”則逐步學會應對大量的隱藏信息。

繼圍棋輸給AI之後,麻將又要被人工智能征服

有網友表示,麻將AI再強,真人實戰中也不一定行。且不說出老千,打牌手勁輕重,出牌方式是甩是拍,摸牌速度快慢,大拇指搓幾下嘴裡嘖幾聲,這都是AI學不會的東西。

好吧,面對人工智能的來襲,人類總是會想要挽留一下最後的尊嚴。

而且微軟開發麻將AI有著更遠大的想法。在現實世界中,金融市場預測、物流優化等很多問題與麻將遊戲有著相同的特點,包括複雜的操作/獎勵規則、信息的不完全性等等。麻將AI背後的全局獎勵預測、先知引導和參數化策略自適應等技術,在現實世界的應用中將大有可為。

在去年的世界人工智能大會上,時任微軟全球副總裁沈向洋就曾提到,遊戲一直是人工智能研究的最佳試驗田,訓練遊戲AI的過程可以不斷提升人工智能的算法和人工智能處理複雜問題的能力。


分享到:


相關文章: