可用于“未来战争”?谷歌AlphaGo新接班人——AlphaStar

可用于“未来战争”?谷歌AlphaGo新接班人——AlphaStar

近日DeepMind开发的全新AI程序AlphaStar横扫了星际2(一款模拟未来战争策略类游戏)的各路高手,引爆了游戏界,其中一位对战的选手发出了这样的感叹:“相信我,和AlphaStar比赛很难,有种手足无措的感觉。”我们先简单说一下AlphaStar的厉害之处:

1、在围棋世界,动作空间只有361种,而星际2大约是10的26次方。

2、AlphaStar模拟了人类观察游戏的方式,图像信息的获取和处理难度相较原来一张棋盘大大增加。

3、游戏中存在“战争迷雾”,无法看到对方的操作、阴影中有哪些单位。这意味着对战过程中的规划、决策、行动,要一段时间后才能看到结果。这类问题的处理在现实世界中具有重要意义。

4、AlphaStar还用了一个新的多智能体学习算法。这个神经网络,经过了监督学习和强化学习的训练。

最初的智能体,游戏内置的精英级 (Elite) AI就能击败,而这个早期的智能体,就是强化学习的种子。

可用于“未来战争”?谷歌AlphaGo新接班人——AlphaStar

在它的基础之上,一个连续联赛 (Continuous League) 被创建出来,相当于为智能体准备了一个竞技场,里面的智能体互为竞争对手,就好像人类在天梯上互相较量一样。

从现有的智能体上造出新的分支,就会有越来越多的选手不断加入比赛。新的智能体再从与对手的竞争中学习。

智能体联赛进行了14天,这相当于让每一个智能体都经历了连打200年游戏的训练时间。

今天AI搞定了《星际2》,DeepMind显然不满足于此,他们的下一步会是什么?

可用于“未来战争”?谷歌AlphaGo新接班人——AlphaStar


哈萨比斯在赛后说,虽然星际争霸“只是”一个非常复杂的游戏,但他对AlphaStar背后的技术更感兴趣。其中包含的超长序列的预测,未来可以用在天气预测和气候建模中。

想了解关于更多人工智能方面资讯或者想从事该行业相关的请关注我,或者搜索公众号:悦马科技,我们是一家将图像识别技术应用于智慧停车,生活服务等场景的科技型企业。


分享到:


相關文章: