「直播」ICLR 2020丨多智能體的動作語義網絡

「直播」ICLR 2020丨多智能體的動作語義網絡

CVPR 2020 系列論文解讀公開課第四期,就在4月23日(本週四)20:00 整(北京時間)進行。


AI科技評論出品

針對目前國際疫情形勢越發嚴峻,無法現場參會進行學術交流的情況,AI研習社聯合AI科技評論組織策劃了頂會系列專題活動,這其中就包括【ICLR 2020 專題】系列活動。而【ICLR 2020系列論文解讀公開課】更是其中重要的組成部分,除此之外,專題還包括系列論文文字解讀,會議數據分析,會議資源下載等。

本次直播為【ICLR 2020 系列論文解讀公開課】第八期,此論文錄用為ICLR 2020 論文《 Action Semantics Network: Considering the Effects of Actions in Multiagent Systems》,我們有幸邀請到了天津大學王維壎博士,帶來關於“動作語義網絡,考慮多智能體系統中動作的影響”的分享。

「直播」ICLR 2020丨多智能体的动作语义网络

論文地址: https://arxiv.org/abs/1907.11461

講師介紹

「直播」ICLR 2020丨多智能体的动作语义网络

王維壎

天津大學一年級博士生,導師為郝建業副教授,研究興趣為:深度強化學習,多智能體深度強化學習 及其 在現實世界的運用。曾在阿里巴巴(定向廣告),網易遊戲伏羲實驗室進行實習,並在相應會議如:AAAI,AAMAS,ICLR,CIKM,DAI等上發表多篇相關論文,並獲得DAI 2019 最佳論文獎。

更多信息請見個人主頁:http://wwxfromtju.github.io

分享時間

4月23日(週四) 20:00整(北京時間)

分享主題

動作語義網絡:考慮多智能體系統中動作的影響

分享背景

從Alpha Go起,深度強化學習引起了學術界與業界的廣泛關注。多智能體深度強化學習(MADRL)因其在現實世界中廣泛的潛在應用,近期成為了學界熱點。

以往的工作為了促進多智能體的協調,將各種多智能體協調機制引入深度學習體系中,然而,它們並沒有明確考慮多智能體之間的動作語義,即不同的動作對其他智能體的影響是不同的。

在這篇論文中,提出了一種新的網絡體系結構,稱為動作語義網絡( Action Semantics Network),能夠顯示地表示智能體之間的動作語義。

本次分享將展示如何將動作語義網絡與深度強化學習(DRL)算法相結合來提高它們的性能,並展示在星際爭霸II、Neural MMO、逆水寒等遊戲中的訓練效果。

分享提綱

1.多智能體系統的基本介紹與當前深度多智能體的進展與相應研究

2.Action Semantics Network的研究動機

3. Action Semantics Network的網絡介紹及相應實驗效果,展示逆水寒的訓練效果(星際爭霸2, OpenAl Neural MMO)

疫情拉開了大家的距離,但是學術交流是不會就因為疫情被阻擋的,我們願架起這座學者之間的橋樑,以最短路徑,讓更多學者能更快的參與其中,促進學術交流,讓知識真正流動!

「直播」ICLR 2020丨多智能体的动作语义网络「直播」ICLR 2020丨多智能体的动作语义网络
「直播」ICLR 2020丨多智能体的动作语义网络


分享到:


相關文章: