統計也能玩花樣 04(詹大師)如何獲得有參考價值的統計分析結果

在日常生活中,我們經常會遇到一些需要進行預測(估計)的情況。與之同時,會遇到一個很實際的問題,老闆會提出一些針對預測(估計)的需求。

統計也能玩花樣 04(詹大師)如何獲得有參考價值的統計分析結果

統計也能玩花樣 04(詹大師)如何獲得有參考價值的統計分析結果

於是,工程師們開始玩命的研究統計學,希望從中找出一種"既能獲得準確可信的估計結果,又能少抽樣"的統計工具。

大家要牢記一點,如果希望通過抽樣來進行某種估計,那麼:

估計的風險是必然存在的

統計學家和半仙們的最大區別在於:

統計也能玩花樣 04(詹大師)如何獲得有參考價值的統計分析結果

換句話說,半仙們的估計是這樣的:

統計也能玩花樣 04(詹大師)如何獲得有參考價值的統計分析結果

而統計學家的估計是:

統計也能玩花樣 04(詹大師)如何獲得有參考價值的統計分析結果

因此,基於統計學而言,總是用一個包含概率的結果來表示估計的結論。這個概率被稱為"置信概率"。可以理解為,我們有多少信心(概率)來保證估計的結果是準確(可信)的。

在收集的信息量相同的情況下,估計結果和估計的置信(可信)概率之間的關係是這樣的。

統計也能玩花樣 04(詹大師)如何獲得有參考價值的統計分析結果

統計也能玩花樣 04(詹大師)如何獲得有參考價值的統計分析結果

統計也能玩花樣 04(詹大師)如何獲得有參考價值的統計分析結果

注:為什麼是-273℃而不是負無窮大,請百度"絕對零度"的定義。

我們發現一個問題,在不增加信息量的情況下,要求增加估計的置信(可信)概率是徒勞的。這個時候,統計上給出的置信區間寬度會隨著置信概率的增加而變大,最終變得毫無參考意義。

如果我們預先規定估計的置信(可信)概率保持不變(比如95%),而又希望獲得有意義的置信區間(這意味著置信區間的寬度應該儘量"窄"),只能通過增加抽樣樣本量來實現。

統計也能玩花樣 04(詹大師)如何獲得有參考價值的統計分析結果

例如,我們查閱GB2828.1的標準,希望獲得一個抽樣計劃來判斷整個批次產品的是否能接受的時候,都會有一個疑問:為什麼要抽那麼多的樣本量?假設,我們查閱GB2828.1,得到一個抽樣計劃是:

抽樣樣本量n=125,不良品數要求:5收6退

那麼,為什麼不能抽25件,1收2退呢?我們用Minitab軟件來計算一下兩種情況下的95%置信區間。

統計也能玩花樣 04(詹大師)如何獲得有參考價值的統計分析結果

對照可以發現,兩種抽樣情況下的95%置信區間的寬度差異非常大。

因此,對於工程師而言,能否找到一種統計方法,實現"抽樣數量少並且估計結果準確"呢?最終結論是:

統計也能玩花樣 04(詹大師)如何獲得有參考價值的統計分析結果

瞭解更多統計工具統計培訓知識,點擊下面鏈接報名


分享到:


相關文章: