為什麼AlphaGo不敢挑戰麻將?

HR講堂

AlphaGo 玩麻將這問題問的絕!忍不住想過來給題主科普一下。

以下是 AlphaGo 的獨白,每一句都刺痛著工程師的心:

“桌子上放的這都是些啥?哦,麻將?”

“為啥還有那麼多種的圖案?我C怎麼還有中文?”

“四個人玩?那我算什麼?他們三個合起夥玩兒我怎麼辦?”

“東西南北中&發財是用來碰的?碰是什麼鬼?什麼時候碰啊?”

“為什麼牌裡還有隻鳥?你說什麼?鳥名字叫么雞兒?是隻雞?”

“胡牌道理我懂,但都是屁胡啊!?”

“我怎麼知道我下一張牌能摸到什麼?我怎麼計算胡一條龍、七小對的幾率?”

“算了,我還是玩圍棋好了。沒圖案、沒文字、不需要摸牌、硬了還沒成就感...”

工程師:

“別自作多情了好嘛,不給你丫玩兒麻將主要是我們都不會玩!!”

“......”


如果從數學的角度來講,撲克、麻將這類牌都太簡單而且都是多人棋牌,計算機只需要記住打出去的牌並計算剩下牌贏的概率即可。偏偏只有圍棋,一對一公平博弈,每一步都有上千種變種可能,單純靠計算是搞不定的,所以自古圍棋出大師,你沒見過自古麻將出大師吧?


  • (點擊關注可以查看更多我的問答動態,歡迎與我交流。圖片來源:Google)
  • (本答案由貓哥@楊明慧原創於悟空問答,基於CC創作共用協議BY-SA發佈)

貓眼智客-楊明慧

無論從歷史傳承、規則設計、牌藝技巧上,阿法狗可以玩圍棋,但離玩麻將還很遠!

在2016年3月進行的圍棋人機大戰中,阿爾法狗(AlphaGo)最終以4:1戰勝了韓國名將李世石九段,引起了全世界的廣泛關注,也讓神經科學和深度學習等概念進入了公眾的視野。2017年5月27日,在柯潔與阿爾法圍棋的人機大戰之後,阿爾法圍棋團隊宣佈阿爾法圍棋將不再參加圍棋比賽。

在阿爾法狗取得令人讚歎的成就後,我們不禁產生了疑問:阿爾法狗對戰我大中華麻將又將如何呢?

中國人對麻將的痴迷最早可以追溯到三四千年以前,它起源於中國的一種休閒遊戲,原屬皇家和王公貴胄的遊戲。在長期的歷史演變過程中,麻將逐步從宮廷流傳到民間,到清朝中葉基本定型。

眾所周知,麻將是四人遊戲,但由於中國麻將因地域的差異性,在規則上也有所不同,那麼勢必以競技麻將的規則為準!

從變化數量上看,麻將和圍棋還是有差距的。數據顯示,圍棋是一種玩法下的10的172次方變化;而麻將是多種玩法下的1736978種變化!其主要格式可以歸納為:n*AAA m*ABC DD,mn可以等於0。

這對於數據的設置、運算來說是一個全新的考驗,它不是一個量變增加的問題,是質變不停更替的問題。雖然算法簡單,但為什麼阿法狗不敢介入麻將領域?這絕不是碰巧,而是膽怯地故意迴避!

從規則上看,麻將與圍棋不同,麻將是一個四人遊戲!一個阿法狗挑戰三個人類,一點勝算沒有;兩個阿法狗挑戰兩個人類,我告訴你們,不要以為勢均力敵,老子一個眼神就知道朋友要什麼牌;三個阿法狗……算了,三個阿法狗太貴了!


鎂客網

我有幾位朋友是日本麻將和競技麻將的頂尖高手,日麻拿過世界比賽前幾名的那種。當時AlphaGo第一篇論文剛出來時,我們就曾討論過類似問題:用神經網絡深度學習的方式來訓練麻將AI會怎麼樣?其實結論並不複雜,訓練出比人類厲害的AI並不難,但很難達到AlphaGo後來能對人類的碾壓程度。這主要是因為麻將和圍棋本身的區別。

首先需要強調的是,圍棋是完全信息博弈,而麻將是不完全信息博弈。一般來說,不完全信息博弈要比完全信息博弈的難度大。但具體到每個項目上,具體到是人來學還是程序來學,都是不一樣的。

圍棋由於變化量過於龐大,可以說是完全信息博弈裡最難的那種;而麻將雖然是不完全信息博弈,但變化量的量級比圍棋小的多。所以頂尖的麻將高手認為,對人類來說,麻將相比於圍棋要容易一些(如果非要對比)。

為什麼這麼說呢?因為麻將從入門到頂尖高手,嵌套的水平差距層級,沒有圍棋從入門走到頂尖的相差差距那麼大。不完全信息博弈看似應該更難,但對人類來說卻不一定。麻將和紙牌類遊戲的不完全信息帶來了大量的運氣成分,反而使得人類選手很難形成極端的互相碾壓。而圍棋不同層級之間的碾壓之徹底,大家應該都懂。

哪怕一個頂尖的麻將高手,可以在很多局比賽中憑大概率碾壓一個新手,但卻也不可能保證局局都贏。對手運氣逆天了怎麼辦?麻將的水平高,其實是針對任何場面,不論順風逆風,都能打出勝率最高的打法。這樣,就算不能保證局局都贏,但打的多了,成績自然就能顯現出來。

如果要訓練一個麻將AI,難度肯定要比訓練一個相同變化量的完全信息博弈AI要難的多,但應該也遠不需要投入訓練AlphaGo那麼巨量的成本,就能得到一個超越人類頂尖水平的程序。但正如前文所說,這種超越最多隻是勝率佔優,並不可能局局都贏。而圍棋AI只要水平超越人類頂尖一定距離,就能保證基本100%的勝率。

其實在解決了最困難的完全信息博弈遊戲之後,嘗試不完全信息博弈也是很有意義的。不過在大量不完全信息博弈中,麻將還是稍嫌簡單了,也許星際爭霸是個更好的選擇。

最後,“不敢挑戰”這種故意挑動情緒的引戰性用詞是沒有意義的。如果關心,請真的關心。


神之一手

今年5月,阿爾法狗(AlphaGo)打敗了柯潔,這個世界圍棋史上最年輕的四冠王,圍棋等級分排名世界第一的頂級棋手。

“我知道圍棋有一天可能會被人工智能打敗,但沒想到這一天來的這麼快”,一個從小下圍棋的朋友說。

不少棋迷看了後心碎不已,但隨著之後阿爾法狗公開自己和自己下的50盤棋譜後,心服口服。朋友身邊聚的一幫棋迷對這50副棋譜嘖嘖驚歎,“原來圍棋能這麼下?!”。他們越鑽研棋譜越發現,在圍棋這個古老的遊戲中,阿爾法狗代表了未來的下法。

柯潔的師傅聶衛平在觀戰後也表示,“阿爾法狗又幾步棋完全出乎我們職業棋手的意料,當時看著奇怪,但是確實下的好,從佈局到中盤都有妙招。完全掌握自如。”

什麼是未來的下法?大概正是這種掌握自如的全局觀。

生物和機器在信息處理方式上的本質差異就在於:人類偶爾會站在全局看問題,但不可能總是保持這種上帝視角,人的生物弱點決定了這一侷限性,可是,“在AlphaGo的每一步棋,它在局部跟你戰鬥,但它永遠看著整個棋盤。”

圍棋只是DeepMind整個棋局的一個極小的局部,正像當年打敗了人類國際象棋大師的超級電腦深藍,也僅是IBM整個棋局的一個局部,IBM從來都不熱愛國際象棋,更不會讓自己成為一家經營國際象棋的公司。

至於當初選擇圍棋,只是因為圍棋是完全信息博弈的最高峰,哈薩比斯說,“它一直是人工智能研究中的一個聖盃”。如果圍棋可以被攻克,那麼其他大量適用於完全信息博弈的問題或許都可以得到解決。

回到題目,阿爾法狗沒有挑戰麻將不是不敢挑戰麻將,而是不屑。阿爾法狗所屬公司DeepMind主要任務也不是炫牌技。


韓福東

前一陣谷歌的“阿爾法狗“
很是囂張啊
在人機大戰中連贏三盤之後
人類代表李世石終於擊中“神狗”死穴
扳回一盤
阿爾法狗:我是假裝輸給人類……
你以為這樣就能戰勝人類了嗎?
聰明的中國人民表示——
阿爾法狗,你敢挑戰中國的麻!將!嗎?
Alphago:我是網紅我先撤了你們慢慢打……

其實,早就有過麻將的AI了,它就是日本東京大學工學系在讀博士生水上直紀開發的麻將人工智能“爆打”。“爆打”和AlphaGo一樣,有自我博弈以及閱讀學習人類牌譜的能力,那麼,它的戰績怎麼樣呢?

“爆打”從2015年開始在最大的日本麻將平臺——天鳳麻雀上開始打,到了2016年2月已經打了約13萬手牌。2015年12月,“爆打”衝進天鳳七段,長期成績平均在六段以上。這意味著“爆打”在天鳳麻雀上的17萬選手中,可以排在5000名左右。而且這還是在日本的排名,要是放我大天朝,一大波兒退休老幹部齊刷刷碾壓你!

阿爾法狗,你聽說過麻將嗎?比圍棋更有群眾基礎……也不乏國際性據說,圍棋的窮舉變化是10的172次方,麻將則遠沒有那麼多。但其實仔細想想,圍棋本來就是需要棋手像計算機一樣去計算、去佈局。所以被計算機戰勝也就不足為奇,或者說是早晚的事情。但麻將則更像人生…阿爾法狗……想征服人類。麻將是起點~~

圍棋要靠自己佈局,每一次落子,深思熟慮, 從無到有。麻將則要看抓上一手什麼牌,就像人生一樣,有人生來就是一手等著地胡的牌,但有人起手就是一把“十三不靠”。不過,牌局的終點會如何,誰是最後的贏家。這還真不好說……開局爛牌,卻不一定會輸,要看你如何打理,做出決斷,有舍有留。選擇是否正確,也要看以後的人生,你永遠不知道摸到的下一張牌會是什麼。就像阿甘的媽媽說過的,人生就像巧克力,你永遠不知道下一顆是什麼滋味。阿甘起手一把爛牌,但他打的還不錯……
打麻將時,扔三筒再抓三筒,這種事情,也是經常遇到的。有人會留下三筒,有人會再次堅決扔出。他們接下來面對的人生和牌局也會截然不同。其實很想知道,人工智能扔三筒抓三筒後如何抉擇……打麻將還要左右逢源。桌上的既是對手,也要加以利用。不像下棋,對面坐的就是對手那麼簡單。麻將的贏法有很多種,你正在憋一個豪華七對,對方已經吃吃碰碰一路小屁,走向勝利了。畢竟不是所有人生和牌局都可以靠“門清自摸”贏得最後。
如果說圍棋是一堂數學課,麻將就是一堂人生哲學課。人生就像打麻將,不在於你是否拿到一副爛牌,而在於你能否打出一手好牌。阿爾法狗恐怕還嫩了點。從深藍到阿爾法狗,過去了19年。等待一隻會打麻將的阿爾法狗不知道還需要多久。而且,圍棋只有一種規則。麻將種類繁多,跟中國菜系一樣博大精深。基本的玩法就分為臺灣麻將、四川麻將、廣東麻將、香港麻將等多種。如臺灣麻將還分13張、16張。
各種旁門左道的玩法,如天上的繁星一樣多,我上大學時,宿舍室友就教會了我們一種當地的扣牌玩法。牌抓上一手(四張)後看一眼,可選擇扣牌。如扣牌就不能再看也不能再換,只能默記於心,胡牌後自動加一番。後在國內各地出差,也見識了更多奇奇怪怪的玩法,有五個人打的,有三個人打的。要想征服麻將,真沒那麼容易。即使過了麻將這關,我們還有鬥地主可以一戰……再轉一個最逗的說法:為什麼阿爾法狗不敢挑戰麻將?因為一個阿爾法狗挑戰三個人類,一點勝算也沒有。兩個阿爾法狗挑戰兩個人類,我告訴你們,不要以為勢均力敵,老子一個眼神就知道朋友要什麼牌。三個阿爾法狗……實在太貴了。
其實就像說明星離婚了,我就再也不相信愛情一樣。阿爾法狗贏了幾盤棋也不必如此驚慌。人工智能還不能好好為服務人類呢,何談取代人類。即使真有那麼一天,著急也沒用。


盛景商業評論

我看到很多人強調圍棋的複雜性,說麻將的簡單,狗狗不屑一顧和麻將一戰。

我不同意這種說法,我堅信狗狗現在沒有辦法能贏麻將,所以才不敢和麻將一戰!請你讀完我的分析文章,再發表你的意見!


第一,圍棋雖然複雜但是在狗狗面前太簡單!

■圍棋通過幾百年的發展,所有開局,中盤,打劫等等都可以說被摸透,並且提出啦什麼樣的佈局針對別人的佈局。很多的應手都是通過千萬次錘練比較後得到最佳應手。粗魯的來說你落這個點,我心裡就有幾種平時練習過的應手。只要不出昏招,基本上鬥下去都是按本在下,只是實戰中為求變化,有時打破常規。看誰對新的變化推算得更快、更準誰就贏。



■我們所有的職業圍棋高手,從小學棋就是按照書本上的指導來學習,按棋譜去打譜,都把每種佈局,中盤變化熟記於心。可以說我們的思維早已被棋譜所影響或者是束縛,就如我們從小就認為地球圍繞太陽轉一樣。不管棋力多高都跳不出棋譜的思維,這就是圍棋參戰人相對狗狗的弱點!


■來看狗狗的圍棋程序,機器人記憶力比我們強,所有棋譜所有變化都被狗狗記住。也就是說按照棋譜走,人會出錯狗狗不會記錯;不按照棋譜走,高手走之中求變。往後的變化人仍然超脫不了棋譜的思維方式,各種變化推算都依據從小學棋的思維模式去分析,但是人的推算肯定是比不過狗狗。狗狗在你走出變招後很快就能把所有的演變加以推理,找出最佳應對。當然狗狗的應對也是跳不出棋譜的思維。

但機器人的記算能力肯定是比我們人強,所以圍棋說複雜,但是在狗狗面前有棋譜這個大框框的思維制約顯得"簡單",所以狗狗圍棋能贏人類!



第二,麻將雖然說沒有圍棋複雜,但是麻將有其特殊性!人性的變化莫測!

■麻將變化沒有圍棋多,但是中間的可變化性遠超圍棋。這個變化性是指打麻將人的性格,打麻將習慣,心態等因素變化。而且人心難測,無章可尋!


■同樣的一局起手牌,讓張三,李四,王五,趙六上去打東西南北位置,打出的結果是一種;換另外4個人上去打,結果又肯定是不同;哪怕只是把第一隊人坐的位置讓張三和李四換,王五和趙六不動,打出來結果又不同。這就是麻將的不同,麻將的變化和魅力。

■麻將本身變化不多,但是人為的因素影響牌局進度不同造成的結果就不同。比如同樣是這把牌44566打出1張牌聽牌,我今天心煩可能就會打隨意牌,隨意丟出5,但是恰恰有人糊這張5,這就改變啦接下來的牌局發展;如果是我今天心態好我會打4或者是打6,打4沒人糊牌,從而沒有改變牌局發展,萬一有人糊牌又會改變牌局。同樣是糊,我的下家糊和我的對家糊或是我的上家糊牌,改變麻將結局都不同。這就是麻將比圍棋複雜的所在。看似簡單,而真正變化複雜,關鍵是這種複雜不按照書本的記載去變化,你讓狗狗怎麼辦?


■狗狗再聰明也不能判一個人的心裡,而打麻將變化就在人的變化,有人喜歡對杵,有人喜歡單吊,有人喜歡卡張,有人喜歡放水貪大。在四個人打麻將中任何一個人"屁眼疼"下,不按常理出牌都會引發本局的變化。比如我是44 78萬的聽牌,摸到手中一張4條,我猜測會點炮,我就不打準備拆搭子。有人拆78萬,有人腦殼有包拆44萬,這種反常思維你讓狗狗以什麼思維邏輯去分析?怎麼去判斷我的牌?

■狗狗沒有可依據的邏輯去推理,它再會記算有屁用,就如上面44 78萬,我摸到炮牌拆搭子,你讓狗狗怎麼猜我放棄聽牌?怎麼猜我拆的78還是44?怎麼去給它設置程序?

所以圍棋看似複雜,在狗狗面前卻有章可尋。而麻將看似簡單,但是人為因素太大,這種變化又無章可尋,所以讓狗狗沒有辦法。我相信開發狗狗的人員也是被這點所難住,所以我說狗狗贏圍棋容易因為有章可循,但是不敢和麻將戰鬥因為麻將無章可循!狗狗現在贏不了麻將!

歡迎各位大俠提出你的不同看法!


麻將換三張

麻將比賽和電競AI一樣,得在公平競爭環境裡進行,這是前提。就像對戰遊戲,如果不限制電競AI的APM操作,人就不可能贏了電腦,試想一下,一分鐘幾千的微操作,懂得人都知道。所以,電競AI和人對戰,最高400。

回過頭來說麻將比賽,如果在電腦上由電腦洗牌(不是同一個AI,只是為了保證不碼牌),一定數量級的牌局以後電腦就可以分析出來這臺設備的隨機函數分佈(人不可能的),並可以用我們想不到的方式計算最優化概率,也就是我們常規認知的猜牌(人類猜不過它的),而且,人類所有的影響輸贏的情緒電腦是沒有的,就算他連摸四個一樣的牌不留也不會生氣,大家知道,棋牌類取勝的關鍵之一,就是心態。

好,前面所有講的,都是在一個相對對大家都比較公平的環境裡進行的,那麼我們討論一個極端的情況,就是3V1 和2V2。

3V1,確實可以大大降低電腦的勝率,但是別忘了,如果按照8圈綜合評比來講,第一個被淘汰的,未必就是電腦,也就是說,AI可以通過四個不同的程序訓練來保持如何取中,因為在這樣的環境裡,AI只要不墊底,在實際的盈利上來講,依然是贏了,儘管這個看起來很難,畢竟,這樣的比賽,沒什麼實際意義,更想是一種AI的壓力對決和反欺騙測試。

2V2條件下,如果允許人類作弊,AI也可以作弊,那基本還是AI勝出,因為人類的一個眼神在AI裡也就是一段加密的代碼,人類所有會的,AI都會(我說的前提是學習人類的欺騙行為,不是共享所有的牌),所以,2V2和1V1沒有區別。

其實,目前,在所有基於計算和分析的領域,只要讓AI學習,我們基本沒有勝率,不要忘了,AI現在連談判都快拿下了,我們人類引以為傲的所謂選擇判斷和部分情感都已經被AI攻克了。

所以,不是AI不敢和麻將鬥地主比賽,是因為再比賽已經沒有實際意義,深度學習挑戰的是神經網絡對一類規則的適應性和實戰經驗,比賽不是關鍵,輸贏都沒有實際意義,重點是深度學習的AI是可行的,這才是價值所在。

從最早的圖靈到當下的AI大爆發,這是人類智慧的延伸,儘管我們不知道這樣發展的最終方向和後果,我們就是這樣好奇而又冒失的進化著,一切看起來偶然,但是又是必然。


身邊人吳晗

回答這個問題之前,想反問一句:憑什麼認為阿爾法狗不敢挑戰麻將?目前阿爾法狗沒有開發出針對麻將的程序,但這與不敢相差甚遠。對於阿爾法狗團隊而言,如果他們認為有必要,開發出打麻將軟件也不是太難的一件事情。只是目前他們認為沒有這個必要。

2016年,阿爾法狗團隊在開發圍棋軟件時的口號是“挑戰人類智慧堡壘”,圍棋蘊涵著無窮無盡的變化,需要人類智慧去挑戰,去征服,在此之前,人工智能已經征服了國際象棋、象棋,日本軟件工程師開發出來的軟件還征服了將棋,圍棋被認為是不可能被電腦征服的智力競技,在這樣的背景下,阿爾法狗團隊才開發出了阿爾法狗,後來又開發出了阿爾法元。

阿爾法狗團隊開發出打敗人類的阿爾法狗、阿爾法元,醉翁之意不在酒,而在於在人工智能方面造福於人類,因為在醫療手術、自動駕駛等方面開發人工智能成本過高,還不易被試驗,所以用圍棋作為突破口再合適不過,意圖很明顯:你看我們現在連“人類智慧堡壘”都攻克了,那麼餘下的自動醫療手術、自動駕駛等還有什麼不能攻克的呢?

麻將存在極大的偶然性,所以目前還不能成為競技,其複雜程度顯然遠遠小於圍棋,既然阿爾法狗團隊連圍棋都能征服,那征服麻將還是問題嗎?


聶衛平

首先要說的是,阿爾法狗不是不敢挑戰麻將,而是還不到時候!

舉個簡單的例子,從一副撲克中抽牌比大小,人工智能也不會挑戰,因為這種玩法全憑運氣,挑戰的意義並不大。

目前,手機上的象棋程序也足可以打敗一個象棋大師,而圍棋一直是人類試圖保持尊嚴的遊戲。圍棋有10的170次方的可能性,在可預見的未來,人工智能的計算速度,不可能遍歷所有的可能性來戰勝人類。因此,有人斷言人工智能在圍棋領域不會超過人類。

1997年,IBM公司的“深藍”戰勝了人類象棋大師,2017年,阿爾法狗戰勝了柯潔,僅僅20年,人工智能就讓人類刮目相看。跳棋、象棋的玩法對於人工智能來說,顯得太簡單,阿爾法狗成功之處,並是像之前的算法一樣,試圖去遍歷所有可能性,而是通過深度學習並不斷強化以及借用蒙特卡洛樹搜索等方法,取得成功。

阿爾法狗的成功,說明了一個最簡單,也最可怕的道理,人工智能是可以學習並不斷進化的。

那阿爾法狗會不會挑戰麻將呢?嚴格來說,答案多半是否定的,因為它主要是為圍棋設計出來的程序,但是,人工智能肯定會。

跳棋、象棋、圍棋之類遊戲是完全信息博弈,每個玩家都可以知道對方手裡是什麼牌,是怎麼走法,採用怎樣的策略,麻將是不完全信息博弈,你不能看到對方手裡是什麼牌,更不能通過他的牌,看他是怎麼樣的打法。不過,這並不代表挑戰沒有意義。

2015年,美國賭場進行了一場德州撲克比賽,人工智能對陣人類頂級撲克玩家,最終結果是撲克玩家以微弱優勢贏得了勝利,儘管結果如此,學術界普遍認為人工智能取得了很大的成功,而德撲正是一種不完全信息博弈。

可以很明確地說,麻將被人工智能挑戰,並不是一件很難的事,也是終將會出現的事情。

說到底,凡是信息可以數字化的,人工智能終將超過人類,因此遊戲領域中,不確定性成份佔的比重越大,人類的贏面反而可能越大。所以,從一副撲克牌中抽出兩張比大小,人工智能和人類對陣的勝負結果,肯定是五五開,否則,以對信息的處理量及處理速度而言,人類永遠會輸給人工智能。

也許某一天,會出現一個人,下圍棋贏阿爾法狗一局,這並不是不可能,畢竟圍棋的可能性接近無限大。不過,這也改變不了人工智能優於人類的事實,因為人類贏的每一局,只不過給阿爾法狗增加一個可以學習的棋局,最終人類還是會敗給人工智能。

也許在某一天,會出現一個機器人跟三個人類打麻將的場景。只是,它可以通過觀察人類抖腿、皺眉、撇嘴等行為舉止,判斷對方手裡是什麼牌,但是人類卻無法觀察人工智能對牌面的反應。

那有什麼是人工智能無法辦到的呢?舉個例子,結婚也是一種博弈,結婚的雙方都無法判斷婚後兩個人是否能過得幸福,因此,結婚多是靠直覺做判斷。如果讓人工智能判斷,它也未必能得出正確的結論。因為這涉及到的信息量太大了,除了兩個人的長相、身高、體重、身份、地位種種因素之外,很可能婚後只因其中一方打呼嚕太響,就會離婚。人工智能估計也無從判斷,另一方是採取包容,還是放棄的策略。


腦力洞察院

這沒啥好說的,像象棋,圍棋這些棋類基本不存在運氣元素。就實打實考慮你的計算力和佈局能力。但是麻將這種東西運氣因素佔了絕大一部分,你計算能力再怎麼牛逼也不可能算出你下一張牌百分百是什麼牌,你最多算一下下一張牌的概率是多少。更不用說麻將是存在那種幾率很低但是的確存在的天胡情況,你再怎麼牛逼,再怎麼計算,也抵不過人家運氣逆天直接天胡直接胡牌,你牌都出不出計算能力再怎麼牛逼也沒辦法杜絕這種情況。


分享到:


相關文章: