大數據文摘出品
入坑深度學習的同學肯定都聽過臺灣大學的李宏毅教授,或者是他那本非常受歡迎的課程——《1天搞懂深度學習》。這門課程的講義PPT總共有286頁,深入淺出的介紹了深度學習的概念、框架及展望。
課程內容通俗易懂,適合深度學習初學者及相關從業人員,在大數據文摘後臺回覆“深度學習”可下載課程講義。
文摘菌今天要給大家推薦的是李老師最近更新的課程:深度強化學習(deep reinforcement learning),目前這門課程在youtobe上更新了4個視頻,分別是策略梯度算法(Policy Gradient)、近端策略優化(Proximal Policy Optimization,PPO)、Q-learning算法基本概念和Q-learning算法高級技巧。
每個視頻大約40分鐘左右,PPT內容為英文,講授語言為中文。課程內容主打強化學習,涉及理論和論文解讀,需要一定的強化學習的基礎,感興趣的小夥伴可以學起來啦!
深度強化學習youtube鏈接:
https://www.youtube.com/watch?v=z95ZYgPgXOY
深度強化學習B站鏈接:
http://www.bilibili.com/video/av24724071
文摘菌對視頻內容做了簡單介紹,供大家參考。
策略梯度算法:
- 策略梯度算法理論
- 算法實現
- 實用建議
近端策略優化:
- 採樣問題
- PPO算法理論
- 對論文結果的解讀
Q-learning算法基本概念:
- 蒙特卡洛方法
- Actor-Critic算法
- Q-learning理論
Q-learning算法高級技巧:
- Double DQN
- Dueling DQN
- 高級技巧
目前課程在連載狀態,感興趣的同學可以關注李宏毅的youtube主頁:
https://www.youtube.com/channel/UC2ggjtuuWvxrHHHiaDH1dlQ/videos
此外,李老師在youtube還有《機器學習》和《深度學習》兩門課程的視頻講解,這兩門課程也獲得了不錯的口碑,課程鏈接如下:
機器學習youtube鏈接:
https://www.youtube.com/watch?v=CXgbekl66jc&list=PLJV_el3uVTsPy9oCRY30oBPNLCo89yu49
機器學習B站鏈接:
http://www.bilibili.com/video/av19144978
深度學習youtube鏈接:
https://www.youtube.com/watch?v=KKT2VkTdFyc
深度學習B站鏈接:
http://www.bilibili.com/video/av20961661
李宏毅老師簡介:主要研究領域為機器學習(特別是深度學習)、口語語義理解和語音識別。
- 2012年從臺北 National Taiwan University (NTU) 博士畢業。
- 2012年9月—2013年8月,在 Sinica Academia 的 Research Center for Information Technology Innovation 做博士後。
- 2013年9月—2014年7月,在 MIT Computer Science and ArtificialIntelligence Laboratory (CSAIL) 的 Spoken Language Systems Group 做訪問學者。
- 現任 Department of Electrical Engineering of National TaiwanUniversity 副教授。
閱讀更多 大數據文摘 的文章