谷歌新AI阿法星,C位出道爆錘人類職業遊戲玩家!

由谷歌的DeepMind子公司開發的AI在星際爭霸II中擊敗了人類專業人士 - 這是人工智能領域的第一個。在油管和Twitch上播出的一系列比賽中,AI玩家連續10場比賽擊敗了人類。在最後一場比賽中,職業球員Grzegorz“MaNa”Komincz能夠為人類奪取一場勝利。

谷歌新AI阿法星,C位出道爆錘人類職業遊戲玩家!

“人工智能的歷史已經在不同遊戲中取得了許多重要的基準勝利,”DeepMind的研究聯合負責人David Silver在賽後表示。 “我希望 - 雖然顯然有工作要做 - 未來的人們可能會回顧[今天],也許會認為這是人工智能系統可以做的又一步。”

在視頻遊戲中擊敗人類可能看起來像人工智能開發的副作用,但這是一項重大的研究挑戰。像星際爭霸II這樣的遊戲對於電腦來說比棋類或圍棋這樣的棋盤遊戲更難。在視頻遊戲中,AI代理人無法觀察每件作品的移動來計算他們的下一步行動,他們必須實時做出反應。

這些因素似乎並沒有成為DeepMind人工智能系統的障礙,被稱為AlphaStar。 首先,在擊敗MaNa之前,它擊敗了職業選手Dario“TLO”Wünsch。 這些遊戲最初於去年12月在DeepMind的倫敦總部進行,但今天與MaNa的最後一場比賽直播,為人類提供了單一的勝利。

谷歌新AI阿法星,C位出道爆錘人類職業遊戲玩家!

專業的星際評論員將AlphaStar的劇作描述為“現象”和“超人”。在星際爭霸II中,玩家在建立基地,訓練軍隊和入侵敵人領土之前從同一地圖的不同側面開始。 AlphaStar特別擅長所謂的“微觀”,即微觀管理的縮寫,指的是在戰場上快速果斷地控制部隊的能力。

這與我們從其他高級遊戲AI看到的行為相呼應。當OpenAI的經紀人去年在Dota 2上扮演人類職業選手時,他們最終被擊敗了。但是專家們指出,AI再次以“清晰和精確”的方式發揮了“催眠作用”。毫無疑問,快速做出決策毫無疑問是機器的主場。

專家們已經開始剖析遊戲並爭論AlphaStar是否有任何不公平的優勢。人工智能AI在某些方面受到了阻礙。例如,它限制每分鐘執行的點擊次數超過人類。但與人類玩家不同,它能夠一次查看整個地圖,而不是手動導航。

谷歌新AI阿法星,C位出道爆錘人類職業遊戲玩家!

DeepMind的研究人員表示,這並沒有提供任何真正的優勢,因為AI在任何時候都只關注地圖的一個部分。但是,正如遊戲所示,這並沒有阻止AlphaStar同時控制三個不同部分區域的單位 - 評論員認為這對人類來說是不可能的。值得注意的是,當MaNa在現場比賽中擊敗AlphaStar時,人工智能正在玩有限的攝像機視圖。

另一個潛在的痛點包括這樣一個事實:人類玩家雖然是專業人士,但並不是世界冠軍標準。特別是TLO還必須參加星際爭霸II的三場他不熟悉的比賽。

除此之外,專家們表示比賽是向前邁出的重要一步。長期參與星際AI場景的人工智能研究員戴夫丘吉爾告訴The Verge:“我認為代理人的實力是一項重大成就,至少比我最樂觀的猜測還要早一年。在AI研究人員中聽到。“

谷歌新AI阿法星,C位出道爆錘人類職業遊戲玩家!

然而,丘吉爾補充說,由於DeepMind尚未發佈任何有關該工作的研究論文,因此很難說它是否顯示出任何技術上的飛躍。丘吉爾說:“我還沒有閱讀過這篇博客文章,或者沒有任何論文或技術細節可以訪問。”

喬治亞理工學院的人工智能教授Mark Riedl表示,他對結果並不感到驚訝,而且這次勝利只是“時間問題。”Riedl補充說,他認為這些比賽並沒有表明星際爭霸II已經存在。明確地被毆打。 “最後,現場比賽,限制AlphaStar到窗口確實消除了一些人為的優勢,”裡德爾說。 “但我們看到的更大問題是,[人工智能]學到的政策是脆弱的,當人類可以將AI推出其舒適區域時,人工智能就會崩潰。”

最終,像這樣的工作的最終目標不是在視頻遊戲中擊敗人類,而是為了加強AI訓練方法,特別是為了創建可以在星際爭霸等複雜虛擬環境中運行的系統。為了訓練AlphaStar,DeepMind的研究人員使用了一種稱為強化學習的方法。 AI在嘗試達到某些目標(如獲勝或僅僅活著)時,通過反覆試驗來玩遊戲。 他們首先通過複製人類玩家來學習,然後在類似體育館的比賽中互相比賽。 最強大的特工生存下來,最弱的特工被拋棄。DeepMind估計其AlphaStar代理商以這種方式累計約200年的遊戲時間,以更快的速度播放。

DeepMind明確了其開展這項工作的目標。 “首先,DeepMind的任務是建立一個人工的一般智能,”AlphaStar項目的聯合負責人Oriol Vinyals說,他指的是建立一個可以執行人類任何心理任務的AI。 “要做到這一點,重要的是要對我們的代理人在各種任務中的表現進行基準測試。”

谷歌新AI阿法星,C位出道爆錘人類職業遊戲玩家!

人工智越來越接近我們的生活,語音助手、人臉識別、虛擬聊天機器人,以及智能交通、無人車等,顯示著人工智能的存在和強大。我們對人工智能期望的同時,也好奇人工智能會給我們帶來什麼?我們怎麼應對呢?

人工智能已經和我們的生活密不可分了,我們更應該深刻習和了解人工智能,比如現在市場上的各種知識學習平臺,知乎、引力先知、得到等等,都是很好的學習人工智能的途徑。其中引力先知,相對於其他平臺來說,內容更加垂直於人工智能AI,在當前的知識分享平臺上來看,還是比較新穎的。

據悉,這是一家國內初創公司發佈的人工智能專屬的學習平臺,主打AI知識分享解讀,以及對暢銷 AI 書籍、AI深度文章、論文的理解和解說。同時還涉及到AI行業前沿資訊,以及對企業來說很有啟發的國內外AI創新案例。不同於知乎Live的實時語音互動問答,以及喜馬拉雅的移動音頻流,先知更傾向於精準垂直的AI人群。或者這正是我們要思考的:人工智能到底有多強大?我們應該明白這一點,因為人工智能有潛力變得比任何人都更聰明。


分享到:


相關文章: