梅宏院士揭秘阿尔法狗的下棋思路!


阿尔法狗怎么做的?

每一个棋,不管是中国象棋、国际象棋甚至我们的五子棋都有一个规则,而且有一个输赢的标准。所以有这个东西我们实际上是可以建立规则,马走日象走田一样。我们形成了一个搜索空间,我们过去的做法都是用计算机去完成的空间的搜索,找出最可能赢的这么一个套路。

这是过去的做法,按照这个套路计算机围棋赢几乎不可能。

梅宏院士揭秘阿尔法狗的下棋思路!

换一个思路大家想想,围棋高手下棋,很多时候是棋感,对当时棋势的把握,棋局的把握。很多高手直觉一来,他就知道下一个棋该到那儿,这就是棋感。

这件事情捅破以后,计算机怎么做?相当于把围棋盘黑白子变为一个图片,那么这件事情恰恰是计算机最擅长的,做图像的匹配和识别。

所以就这么一个纸的捅破,把过去完全是用规则的方式,把它变为一个图像识别。我们做所有的智能,感知智能,我们人脸识别也好,指纹识别也好,再强大的人类高手,你要识别指纹都识别不过计算机。

首先,它是用的数据,这个数据就是人类不可能去想象出来。阿尔法狗用到的数据,三万多幅人类专业棋手对决的棋谱,三千万盘自我对弈的棋局。它用人类的棋谱,打谱学习,然后自己又和自己下棋,最新版的阿尔法狗Zero,用了490万盘,自己和自己对弈。大家想想人类的棋手每年下多少?大概一千盘了不起,脑袋能记多少?再牛的人也记不了多少。

梅宏院士揭秘阿尔法狗的下棋思路!

微软亚洲研究院郑宇等人总结的Alphago原理图

这个图像一存在,这么多幅同样的图像,差不多这个格局一出现的时候,这个图像计算机快速一比对,就知道从概率上,下一步棋往哪儿走。

可以预测,在围棋里面你再怎么样,人类已经不可能赢过计算机了。


分享到:


相關文章: