03.01 機器學習的核心方法、有趣的結論和主要應用是什麼?

coco賈鴻超


監督學習

1.決策樹:決策樹是一種決策支持工具,它使用樹狀圖或決策模型及其可能的後果,包括機會事件結果,資源成本和效用。

從商業決策的角度來看,決策樹是人們必須要問的最少數量的是/否問題,以評估大多數時間做出正確決策的可能性。作為一種方法,它使您能夠以結構化和系統化的方式處理問題,以得出合乎邏輯的結論。

2.樸素貝葉斯分類:樸素貝葉斯分類器是一組簡單的概率分類器,基於貝葉斯定理和特徵間的強(獨特)獨立性假設。

P(A | B)=P(B | A)*P(A)/P(B)

一些現實世界的例子是:

  • 將電子郵件標記為垃圾郵件或不是垃圾郵件
  • 分類關於技術,政治或體育的新聞文章
  • 檢查一段表達積極情緒或負面情緒的文字嗎?
  • 用於人臉識別軟件。

3.普通最小二乘迴歸:如果你知道統計,你可能以前聽說過線性迴歸。最小二乘法是一種執行線性迴歸的方法。您可以將線性迴歸看作通過一組點擬合直線的任務。有多種可能的策略來做到這一點,“普通最小二乘”策略就是這樣 - 你可以繪製一條線,然後對每個數據點測量點和線之間的垂直距離,並將它們相加; 擬合線將是這個距離總和儘可能小的那條線。

線性指的是您用來擬合數據的模型類型,而最小二乘指的是您正在最小化的錯誤度量類型。

4. Logistic迴歸:Logistic迴歸是一種用一個或多個解釋變量建模二項式結果的強大統計方法。它通過使用邏輯函數估計概率來測量分類因變量和一個或多個自變量之間的關係,邏輯函數是累積邏輯分佈。

……太多了


硅發佈


機器學習分為三個分支:監督學習、非監督學習、強化學習


監督學習

監督學習簡單理解,機器學習的樣本有明確的標籤。數字圖片識別任務,會有對應的正確的標籤。例如,輸入一個圖片,也會輸入圖片真實對應的數字。

在提到監督學習用處之前,需要大概瞭解監督學習比傳統的程序強在哪裡。在我的“

一句話解釋神經網絡”中有解釋。傳統程序的前提是需要人類給出明確的判斷邏輯,但是現實中很多問題並沒有明確的定義。例如 輸入一行喵咪的圖片,需要計算機判斷,這是貓還是不是貓。這對於傳統計算機非常困難,因為喵有不同形態,品種,動作,背景,顏色,圖片中的位子。而計算機接受的只是圖片的像素,這非常通過人來定義貓咪。


那麼監督學習是怎麼作的呢? 其實我們也不能完全講清楚,小朋友怎麼認識喵咪的。但是我們知道,當她看得多了,她就能夠憑感覺判斷是不是喵咪,這就是一個學習的過程。

而監督學習神經網絡也能做到這一點,當神經網絡訓練完成後。也能夠對不同的圖片給出自己的判斷。至於判斷的原理及細節,可以參考我的文章“機器學習的hello world”


那麼監督學習的應用在哪裡呢? 例如,醫療診斷,語音識別,圖片識別,輸入法預測等等。如醫療診斷,當已經用10萬個X光照片,訓練之後的神經網絡。 它可以基於新的X光照片給出它的診斷結果。


非監督學習

非監督學習對應著監督學習,不同點就在於其沒有標籤。 比如,輸入5萬張圖片,但是沒有告訴機器每張圖片對應的數字。 它要自己學習。


我知道的非監督學習算法有K-Means,Autoencoder等。這些算法的意義實際上是,發掘數字背後的趨向性,數字背後的規律。


那麼非監督學習的應用,就我個人而言,之前用非監督學習做過客戶分層的應用。傳統客戶分層只有兩個緯度,人口特徵,地理特徵。 比如 化妝品目前客戶 可能定位在 北京 年輕女性。 但是現代客戶有大量的數據,個人的特徵值也超出了傳統人口特徵、地理特徵的範圍。比如在社交平臺上活躍度、旅行次數、月消費數量、日均上網時間、某個商品的消費頻率等等。那麼當客戶有200個特徵值的時候,我們如何作客戶分層呢?


強化學習

強化學習應該是屬於最好玩的類型,強化學習也是阿法狗Zero的核心之一。

強化學習(Reinforcement Learning)是通過試錯來學習,學習環境,學習完成任務。強化學習有很多算法,如Q-Learning,DQN,Sarsa等等。

強化學習與之前兩種不同的地方在於,他可以學習環境,自主完成任務。簡單理解,比如一個虛擬機器人學會走路。 至於強化學習的應用場景簡直無可限量,比如自動駕駛,機器人服務等等等

甚至強化學習還能用來打牌,21點。 我之前一篇文章有完整的解釋“十分鐘機器學會打牌|強化學習Q-Learning”


總之,機器學習發展非常快,是一項會改變世界的技術。


分享到:


相關文章: