算法數學基礎-統計學中的抽樣你瞭解麼?

抽樣簡單理解就是對總體的一次觀察,n次抽樣後就構成了一組觀察值。統計的目的就是從這組觀察值出發尋找總體的規律。平時接觸的比較多或者比較熟悉的就是平均值、方差、標準差、矩等,它們實際上是對樣本觀察值的處理函數,比如均值就是就和再除以總數,這個函數關係就叫做統計量。注意以下,統計量就是構造一個分析樣本觀察值的函數。對樣本的統計量就加上樣本兩個字就好了,如樣本平均值、樣本方差、樣本標準差、樣本矩。所以我們對總體規律的研究至此轉化為對樣本特性的挖掘了。所以我們要研究樣本的特點通常是從上述幾個統計量入手的,當然也可以自己依據問題來設計統計量。當然能這麼做的依據就是之前講過的大數定律!

經驗分佈函數:我們在已知樣本觀測值的情況下,居然可以先估計一個總體的經驗分佈函數。F(X)=1/NS(X),S(X)為不大於X的隨機變量個數。而格里文科證明了對於任意x,當n趨於無窮時,經驗分佈函數收斂於分佈函數!注意F(X)就是概率,而不是概率密度。等於使用樣本對概率進行了分段,細想一下也是基本直觀的結論。

統計量的分佈也稱為抽樣分佈,以下是幾個正態總體的幾個常用統計量的分佈:

1、X2分佈:假設X1....Xn來自標準正態分佈N(0,1)的樣本,則統計量X2=X12+....XN2服從自由度為N的X2分佈;

2、t分佈:如果X-N(0,1)分佈、Y滿足X2分佈,則隨機變量t=X/根號下Y/n稱為服從自由度n的t分佈。

3、F分佈:U-X2(n1),V-X2(n2),且U、V相互獨立,則隨機變量F=U/n1/V/n2,服從自由度(n1,n2)的F分佈,記為F(n1,n2)。

上述三個分佈都是在總體為正態的假設條件下給出的,可以看出這三個分佈都是隨機變量函數的分佈,與概率論中討論的隨機變量函數分佈又對應上了,不過這些分佈有正態分佈假設的約束,為什麼會用到這些統計量?先不說原因了,大家只要先有個印象就好了,它們在統計中的應用是非常廣泛的,包括在參數估計、假設檢驗、方差分析中都有非常重要的應用。開始不理解沒有關係,隨著後續內容的推進會一點點領會貫通的。

至此數理統計的一些基本概念就介紹完了。


算法數學基礎-統計學中的抽樣你瞭解麼?


分享到:


相關文章: