臺大李宏毅教授最新課程,深度強化學習有國語版啦!

臺大李宏毅教授最新課程,深度強化學習有國語版啦!

大數據文摘出品

入坑深度學習的同學肯定都聽過臺灣大學的李宏毅教授,或者是他那本非常受歡迎的課程——《1天搞懂深度學習》。這門課程的講義PPT總共有286頁,深入淺出的介紹了深度學習的概念、框架及展望。

課程內容通俗易懂,適合深度學習初學者及相關從業人員,在大數據文摘後臺回覆“深度學習”可下載課程講義。

文摘菌今天要給大家推薦的是李老師最近更新的課程:深度強化學習(deep reinforcement learning),目前這門課程在youtobe上更新了4個視頻,分別是策略梯度算法(Policy Gradient)、近端策略優化(Proximal Policy Optimization,PPO)、Q-learning算法基本概念和Q-learning算法高級技巧。

臺大李宏毅教授最新課程,深度強化學習有國語版啦!

臺大李宏毅教授最新課程,深度強化學習有國語版啦!

每個視頻大約40分鐘左右,PPT內容為英文,講授語言為中文。課程內容主打強化學習,涉及理論和論文解讀,需要一定的強化學習的基礎,感興趣的小夥伴可以學起來啦!

深度強化學習youtube鏈接:

https://www.youtube.com/watch?v=z95ZYgPgXOY

深度強化學習B站鏈接:

http://www.bilibili.com/video/av24724071

文摘菌對視頻內容做了簡單介紹,供大家參考。

策略梯度算法:

  • 策略梯度算法理論
  • 算法實現
  • 實用建議

近端策略優化:

  • 採樣問題
  • PPO算法理論
  • 對論文結果的解讀

Q-learning算法基本概念:

  • 蒙特卡洛方法
  • Actor-Critic算法
  • Q-learning理論

Q-learning算法高級技巧:

  • Double DQN
  • Dueling DQN
  • 高級技巧

目前課程在連載狀態,感興趣的同學可以關注李宏毅的youtube主頁:

https://www.youtube.com/channel/UC2ggjtuuWvxrHHHiaDH1dlQ/videos

此外,李老師在youtube還有《機器學習》和《深度學習》兩門課程的視頻講解,這兩門課程也獲得了不錯的口碑,課程鏈接如下:

機器學習youtube鏈接:

https://www.youtube.com/watch?v=CXgbekl66jc&list=PLJV_el3uVTsPy9oCRY30oBPNLCo89yu49

機器學習B站鏈接:

http://www.bilibili.com/video/av19144978

深度學習youtube鏈接:

https://www.youtube.com/watch?v=KKT2VkTdFyc

深度學習B站鏈接:

http://www.bilibili.com/video/av20961661

李宏毅老師簡介:主要研究領域為機器學習(特別是深度學習)、口語語義理解和語音識別。

  • 2012年從臺北 National Taiwan University (NTU) 博士畢業。
  • 2012年9月—2013年8月,在 Sinica Academia 的 Research Center for Information Technology Innovation 做博士後。
  • 2013年9月—2014年7月,在 MIT Computer Science and ArtificialIntelligence Laboratory (CSAIL) 的 Spoken Language Systems Group 做訪問學者。
  • 現任 Department of Electrical Engineering of National TaiwanUniversity 副教授。


分享到:


相關文章: