OpenAI five槓上DOTA玩家,究竟誰能雄霸天下?

OpenAI背景:由多位硅谷大亨聯合建立的人工智能非營利組織。2015年馬斯克與其他硅谷科技大亨進行連續對話後,決定共同創建OpenAI希望能夠預防人工智能的災難性影響,推動人工智能發揮積極作用。

OpenAI five槓上DOTA玩家,究竟誰能雄霸天下?

人工智能的智能有多種方面,OpenAI團隊選擇使用DOTA作為通用AI系統的測試平臺,通過遊戲來捕捉混亂而又連續的世界本質,比如團隊合作、長遠的視野和隱藏的信息。

電子競技本就是一個複雜的領域,與下圍棋下象棋的最大不同,就是這並不是場個人秀,與隊友間的合作很重要。

換句話說,用這款遊戲來測試,AI的協作意圖很明顯。

OpenAI five槓上DOTA玩家,究竟誰能雄霸天下?

2017年8月11日,擊敗人類頂級職業玩家Dendi。

這場陣容,雙方中線影魔solo,順便提一句,影魔solo是個很取巧的選擇,把遊戲裡的變量減少到了極致。

從AI對Dendi的表現上來看,它取勝的關鍵也無非是精準的影壓,取消技能,和卡兵,換句話說,就是操作。

鑑於1v1主要比拼機械技能,AI擊敗人類玩家並不奇怪。

對戰中幾乎沒有必要進行長期規劃或協調,也體現不了協作的意圖,這次比賽宣傳意義大於科研價值。

更值得一提的是,與Dendi比賽結束後,AI被現場水友掉打,這個結果估計是他們團隊沒有預料到的。

2018年1月,OpenAI團隊第一次宣佈5V5訓練結果,與他們編寫的腳本機器人對戰勝利。

2018年4月,OpenAI團隊在官網宣佈:AI機器人在DOTA2中擊敗了人類,這是一件大事,因為他們的勝利需要團隊合作,這是推動人工智能發展的一個巨大里程碑。

2018年6月,這次AI對戰OpenAI員工,也是AI首次與人類進行團戰。

OpenAI five槓上DOTA玩家,究竟誰能雄霸天下?

2018年8月,OpenAI在可以容納數千人的直播間進行直播比賽。

OpenAI five槓上DOTA玩家,究竟誰能雄霸天下?

第一局與觀眾志願隊伍進行公開比賽,結果僅用14分鐘就獲得勝利(實力相當的匹配一局下來平均用時45分鐘)。

第二局在24分53秒內贏得了比賽。

第三局比賽,觀眾為AI選擇了弱勢英雄,最終AI在35分47秒後輸掉了第三局。

兩週後,OpenAI征戰TI8,不過這一次AI並不順利。

首場對戰南美賽區的隊伍PG,這支隊伍是本次TI 18支隊伍中首個被淘汰的隊伍。比賽採用BO1的模式,一局定勝負。這是AI首次在DOTA2最高級的比賽上以5V5的形式對陣人類職業選手。

第二場對戰給了中國玩家一個驚喜,AI對戰來自中國的五位前職業玩家,他們都是中國DOTA圈元老級人物。在比賽前,OpenAI Five的工程領隊Greg Brockman在賽前表示,遵守三局兩勝的戰局。

不過這次很遺憾,AI兩都次敗給人類玩家。

OpenAI團隊對這次的比賽進行了一次總結,下面為團隊博文翻譯。

OpenAI Five 在DOTA 2 全球頂級賽事 TI8(The International DOTA2 Championships)中與人類職業玩家打了兩場,輸了兩場。其實在比賽過程中,人工智能在前期,特別是在前20~35分鐘,一直佔據著上風。

這次比賽與17天前的Benchmark賽相比,有以下特點:

這次的對手更加強大

英雄陣容由第三方提供

比賽規則的一些限制對AI不利

因為OpenAI Five的五名AI“隊員”是從零開始訓練的,所以這場專業比賽中,AI的表現仍然令人興奮。與人類頂級選手對決,如果贏得了比賽當然是非常好,如果比賽輸了也會給我們帶來非常寶貴的經驗,幫助OpenAI Five更上一層樓。

OpenAI five槓上DOTA玩家,究竟誰能雄霸天下?

規則變化

這次比賽的目的是想看看OpenAI Five 的能力與世界頂級玩家的差距在哪裡,與之前的比賽相比,這次的比賽更加正式也更加真實。在比賽之前,我們並不知道將會與誰交手,因為這取決於有誰願意與我們比賽。

很高興有如此強大的隊伍與我們比賽,相對於之前的Benchmark,我們這兩天獲得了更多的寶貴經驗。

OpenAIFive的第一場比賽是昨天與paiN的對決,雖然這支戰隊在角逐冠軍的時候被淘汰了,但是做為Dota2 18支頂級戰隊中的一支,仍然有著強大的實力。並且,這支隊伍在職業錦標賽中平均贏得了350000美元。

第一場比賽持續了51分鐘,這個時間有些略長,因為一局遊戲平均下來只有45分鐘。在遊戲的中期OpenAI Five重新獲得了一些優勢,但是最終還是輸給了人類玩家的策略搭配。

第二場比賽的對手是中國名人堂的選手,他們每一位都身經百戰,這場比賽持續了45分鐘,和上一局一樣,在中前期OpenAI Five佔據著上風,但是在一系列激烈團戰後,OpenAI Five由優勢轉為劣勢,然後輸掉了比賽。

OpenAI five槓上DOTA玩家,究竟誰能雄霸天下?

在之前的Benchmark比賽中,我們配備了一項重要的限制條件:允許每個英雄一個自身的安全信使(一個向你的英雄傳遞道具的單位),而不是一個團隊的可被破壞的信使。而我們在這兩日的比賽中解除了這項限制。

信使可以不斷運送英雄的恢復品,使得OpenAI更容易保持英雄的狀態,頻繁的參與到對敵方的進攻中。在一場Dota比賽中,狀態較差的英雄可能會放棄進攻,選擇回家補充狀態。很多觀眾認為,附加的信使會讓遊戲看起來不像“真正的Dota”。

我們在六天之前展開訓練(信使和其他項目一樣,是代碼中的一項)。當我們認為單一信使會暫時降低Five的表現時,Dota社區則認為單一信使會讓比賽更加激動人心。

接下來的目標

我們不認為信使的變化是失敗的原因。我們認為,我們還需更多的訓練,進行漏洞修復,以及將模型中最後一塊照本宣科的部分移除。我們期待著將OpenAI Five推向下一個等級。

這兩日的對戰重新讓我們認識到了Dota人機對戰中的差異,也給了我們更多的想象空間。但是OpenAI Five的設計並不只是針對Dota 2這樣一個遊戲,它更多的技術探討是如何將AI技術建立在一個安全的沙盒中,而這個沙盒會幫助我們在未來建立先進性的系統。

原文鏈接:

https://blog.openai.com/the-international-2018-results/

這一次AI征戰DOTA以失敗告終,其實是可以預見的,真正的人工智能還有很長路要走,樂觀點說失敗也是進步的一種表現形式。


分享到:


相關文章: