機器學習數學篇—基礎數學知識清單

到目前為止我們學習了,最小二乘法,邏輯迴歸,樸素貝葉斯,決策樹,神經網絡,卷積神經網絡。裡面提到了很多的數學概念,有懂得,也有不懂的,今天我們來列一個清單以便於後面的學習。

其實有同學也再問:“孫老師,你為什麼不先講數學知識,然後再講機器學習呢,就像小時候上學一樣,先學加減法,再學乘除,一年級一年級的往上學。”

首先這個同學問的問題非常好,一看,就是個三好學生。但是咱們不是義務教育,也不是小時侯了,大人要有大人的學習方法,如果一開始的時候就說:“學習機器學習需要花個2年時間去學習微積分,線性代數,概率論,數理統計,信息論這些數學知識,然後才能開始進入機器學習的階段。” 我想這時候本來計劃要學習的同學,一大半都要放棄了,尤其是已經工作幾年的程序員,各種身不由己。然而真正好的學習方式是帶著任務去學習,比如正在看一篇自然語言處理的文章,裡面講了兩篇文章的相似度是根據餘弦定理來判定的,假設你又不懂餘弦定理是幹什麼的,那麼這時候你就把學習餘弦定理作為一個學習的任務,這個就是一個很好的學習方式。由任務來驅動,用搜索的方式去學習。

周志華老師的西瓜書很早就買了,但是並沒有從第一頁翻到最後一頁的去看,而是先看序言,再看目錄,找到自己感興趣的內容和章節去學習。還有就是看博客學習,看論文的時候遇到生疏的概念,會去周老師的書裡查找,當作“新華字典”去用。但是千萬不要去背一些概念,只是僅僅記住文字沒有用的 ,要去理解,去一層一層的尋找數學原理,很多難懂的概念都是建立在最基礎的數學定理上面,要耐心的去深挖,直到初等數學基本定理。

機器學習數學篇—基礎數學知識清單

機器學習數學篇—基礎數學知識清單

機器學習數學篇—基礎數學知識清單

機器學習數學篇—基礎數學知識清單

還行吧,也沒那麼恐怖,現在看來還有些可愛呢。

下面列出目前為止涉及到的數學知識,專有名詞(持續更新中):

一. 線性代數

  1. 向量

  2. 矩陣

  3. 集合

  4. 標量

  5. 張量

  6. 範數

  7. 內積

  8. 向量正交

  9. 正交基

  10. 特徵值分解

  11. 奇異值分解

二. 概率論

  1. 條件概率

  2. 聯合概率

  3. 全概率公式

  4. 逆概率

  5. 貝葉斯公式

  6. 貝葉斯定理

  7. 先驗概率

  8. 後驗概率

  9. 似然概率

  10. 最大似然估計法

  11. 最大後驗概率法

  12. 離散型隨機變量

  13. 連續型隨機變量

  14. 概率質量函數

  15. 概率密度函數

  16. 兩點分佈

  17. 二項分佈

  18. 泊松分佈

  19. 均勻分佈

  20. 指數分佈

  21. 正態分佈

  22. 數字特徵

  23. 數學期望

  24. 方差

  25. 協方差

三. 數理統計

  1. 樣本

  2. 總體

  3. 統計量

  4. 參數估計

  5. 假設檢驗

  6. 置信區間

  7. 區間估計

  8. 泛化能力

  9. 泛化誤差

  10. 欠擬合

  11. 過擬合

  12. 噪聲

  13. 偏差

四. 優化相關

  1. 目標函數

  2. 全局最小值

  3. 局部極小值

  4. 無約束優化

  5. 約束優化

  6. 拉格朗日函數

  7. 梯度下降法

  8. 梯度方向

  9. 一階導數

  10. 二階導數

  11. 牛頓法

  12. 泰勒展開

  13. 線性搜索方法

  14. 置信域方法

  15. 啟發式算法

五.信息論

  1. 信息熵

  2. 互信息

  3. 信息增益

  4. KL 散度

  5. 最大熵原理

列這樣一個表的目的是出一個‘測試集’,按照機器學習的套路來,平常同學們自己學習就相當於機器學習中用訓練集數據去訓練,調優,等準確率提高到一定程度,再把模型放到測試集去訓練看最後結果,同學們學習一段時間,自我感覺良好了,可以把這個列表拿出來看檢驗一下,然後在去天池,kaggle上找個比賽參加一下,這樣反覆的來幾個回合,效果一定非常好。

當然不會只是這樣一個列表,接下來當然會詳細介紹一下每個章節的每一個名詞的概念。


分享到:


相關文章: