摘要: 人類基於先驗知識決策,對於機器學習來說,先驗知識 = 樣本數據。本文主要先講述機器學習的原理,再詳解學習率。
上篇回顧:
一、機器學習分類:分類、迴歸、聚類
把樣本映射到多維空間上,每個特徵值對應一個維度的座標值,則樣本有以下三種關係
1. 分類:類似的樣本存在分界線
2. 迴歸:樣本存在擬合曲線
3. 聚類:類似的樣本聚在一起。
顯然,問題的關鍵在於"線"。
二、機器學習最重要最基礎的方程。
在二維空間就是直線方程,在三維空間就是平面方程。
有朋友可能會疑惑,非線性關係怎麼辦?
通過空間映射可以把非線性問題轉換線性問題。
通過求解w,即可解決問題,那麼如何求解w呢?
那麼如何才能找到最優權重w呢?
三、學習率
損失與權重圖如下(梯度下降法)
每次移動的步長,稱為學習率。
上圖是原理解釋,實際上學習率如下
對應三維圖如下
顯然,學習率需要不斷調試優化。
以上算法都是為了使訓練能找到最優權重。
閱讀更多 IT老友 的文章