可用於“未來戰爭”?谷歌AlphaGo新接班人——AlphaStar

可用於“未來戰爭”?谷歌AlphaGo新接班人——AlphaStar

近日DeepMind開發的全新AI程序AlphaStar橫掃了星際2(一款模擬未來戰爭策略類遊戲)的各路高手,引爆了遊戲界,其中一位對戰的選手發出了這樣的感嘆:“相信我,和AlphaStar比賽很難,有種手足無措的感覺。”我們先簡單說一下AlphaStar的厲害之處:

1、在圍棋世界,動作空間只有361種,而星際2大約是10的26次方。

2、AlphaStar模擬了人類觀察遊戲的方式,圖像信息的獲取和處理難度相較原來一張棋盤大大增加。

3、遊戲中存在“戰爭迷霧”,無法看到對方的操作、陰影中有哪些單位。這意味著對戰過程中的規劃、決策、行動,要一段時間後才能看到結果。這類問題的處理在現實世界中具有重要意義。

4、AlphaStar還用了一個新的多智能體學習算法。這個神經網絡,經過了監督學習和強化學習的訓練。

最初的智能體,遊戲內置的精英級 (Elite) AI就能擊敗,而這個早期的智能體,就是強化學習的種子。

可用於“未來戰爭”?谷歌AlphaGo新接班人——AlphaStar

在它的基礎之上,一個連續聯賽 (Continuous League) 被創建出來,相當於為智能體準備了一個競技場,裡面的智能體互為競爭對手,就好像人類在天梯上互相較量一樣。

從現有的智能體上造出新的分支,就會有越來越多的選手不斷加入比賽。新的智能體再從與對手的競爭中學習。

智能體聯賽進行了14天,這相當於讓每一個智能體都經歷了連打200年遊戲的訓練時間。

今天AI搞定了《星際2》,DeepMind顯然不滿足於此,他們的下一步會是什麼?

可用於“未來戰爭”?谷歌AlphaGo新接班人——AlphaStar


哈薩比斯在賽後說,雖然星際爭霸“只是”一個非常複雜的遊戲,但他對AlphaStar背後的技術更感興趣。其中包含的超長序列的預測,未來可以用在天氣預測和氣候建模中。

想了解關於更多人工智能方面資訊或者想從事該行業相關的請關注我,或者搜索公眾號:悅馬科技,我們是一家將圖像識別技術應用於智慧停車,生活服務等場景的科技型企業。


分享到:


相關文章: