小學文化的人如何快速弄懂機器學習的迴歸、聚類、分類等算法?

哪怕笑得再大聲

小學文化程度要弄懂這些算法……還要快速……

就拿回歸來說吧,迴歸最簡單的類型是線性迴歸。線性迴歸的公式看起來挺簡單的。

然而:(括號裡是小學文化程度的人會問的問題)

  • y是因變量(因變量是什麼?)
  • w是參數向量(向量是什麼?)
  • X為觀測的特徵矩陣(矩陣是什麼?)

呃,好像講不下去了。既然用公式比較麻煩,那不如用圖形來解釋。俗話說得好:“一圖勝千言”嘛!

我們有一些點,現在我們需要找出一條直線,來代表這些點。找這條線的過程,就是線性迴歸。

果然還是圖有用嘛!

但是也就到此為止了。再深入下去,就出問題了。

  • 這個兩根數軸交叉著是什麼意思?還有點怎麼能不在數軸上呢?(小學只講了數軸,沒講直角座標系)
  • 你說“這條線可以用y = ax + b這個函數表示,關鍵在於找到a和b這兩個參數”,可是函數是什麼東西?

也就是說,只用小學程度的數學,即使我們要準確地表述線性迴歸的目標,也很困難。而要表述線性迴歸的具體過程,比如最小化均方誤差,就更難了。

聚類也是一樣。簡單來說,聚類就是計算一些點之間的距離,把距離近的點分到一組中去。

可是距離的計算方法,比如最常用的歐幾里得距離:

又涉及到很多小學數學中沒有的概念。當然,實際上,真正使用這些算法的時候,歐幾里得距離之類的東西,都有現成的方法由計算機自動計算。然而,無需記憶計算公式,並不意味著你不需要理解定義,否則你會很難理解歐幾里得距離的優缺點,和其他距離計算方法有什麼不同,何種情況下使用歐幾里得距離,何種情況下用其他距離。

所以說,僅僅使用小學的知識,弄懂迴歸、聚類、分類這些算法是極其困難的,更別說快速弄懂了。太多習以為常的概念,小學數學裡全都沒講。僅僅使用小學知識,也許最多隻能大概瞭解迴歸、聚類、分類最基本的概念,幾乎不可能理解具體的算法。

所以,我只能說,不要著急,補習一點數學知識,之後再來學習這些算法。這可能不快速,但可能是最快的路徑。


論智

小學文化,想弄懂人工智能方面的東西,需要補充的課程太多了。

初中到高中的數學課程,需要補充。

計算機編程的內容要補充。

這只是最起碼的。


分享到:


相關文章: