03.01 機器學習中常用的概率分佈有哪些?

手機用戶95992772337


高斯分佈

首先當然是高斯分佈(Gaussian distribution),也叫正態分佈(normal distribution)

這是最著名也是最常用的分佈了。

用均值和方差可以描述高斯,下圖為4個均值、方差不同的高斯分佈。

高斯分佈在機器學習中應用十分廣泛。一般情況下,我們往往假設數據符合高斯分佈。比如,當數據符合高斯分佈時,最大似然和最小二乘法等價。

當數據分佈比較複雜,高斯分佈不足以描述時,我們常常使用混合高斯分佈(Mixture Gaussian distribution),也就是組合使用多個高斯分佈。下圖混合了三個方差相同、均值不同的高斯分佈。

伯努利分佈

機器學習最常見的使用場景之一是分類問題。如果我們將一個數據點屬於某個分類記為1,不屬於某個分類記為0。那麼,由於該數據點要麼屬於某個分類,要麼不屬於某個分類,兩者必居其一,因此該數據點的分類要麼是1,要麼是0. 這符合伯努利分佈(Bernoulli distribution)。因此,伯努利分佈也是機器學習中的常用分佈。

形式化的定義為:

若隨機變量的取值僅有1和0,(相應的概率為θ和1 - θ),那麼該隨機變量滿足伯努利分佈,遵循以下概率分佈函數:

二項分佈

相應地,只有兩個可能結果的隨機試驗稱為伯努利試驗(Bernoulli trial)。一系列獨立的n項伯努利試驗的結果滿足二項分佈(Binomial distribution)。實際上,當n=1時,二項分佈即為伯努利分佈。

貝塔分佈

上面的伯努利分佈和二項分佈都是離散概率分佈。當我們需要處理連續概率分佈時,常常使用貝塔分佈(Beta distribution)

(不同貝塔分佈的概率密度函數,圖片來源:維基百科)

貝塔分佈是定義在[0, 1]區間上的連續概率分佈。而[0, 1]恰好是概率的取值範圍(0%到100%)。這也就意味著,貝塔分佈適應用來描述概率的概率分佈——也就是先驗,你不知道具體的概率,但對概率的分佈有一些猜測。


分享到:


相關文章: