簡單的說說"假設檢驗"的思想

假設檢驗(Hypothesis Test),顧名思義,就是假設和檢驗,即尋找證據"檢驗"我們的"假設"是對是錯

簡單的說說

假設是相對於問題來說的,我們對於一個問題的答案有自己的預先判斷(即假設)。而為了證明我們的判斷是否正確,我們需要收集證據並根據一定的判斷標準來證明它。所以,根據邏輯可以簡單的把假設檢驗的過程分為4個步驟:

Step1,明確問題和假設

Step2,收集證據(p)

Step3,確定判斷標準(α)

Step4,得出結論(根據p和α的對比)

現在我們舉一個具體的例子來說明下每個步驟的邏輯推理是怎樣的

Step1,明確問題和假設

比如說,我們現在想研究一個問題:使用頭條APP的用戶中男性多還是女性多?我們根據自己的經驗預先判斷這個問題的答案是:使用頭條APP的用戶中男性更多(即男性>女性)。而我們的判斷的對立面是:使用頭條APP的用戶中男性不比女性用戶多(即男性<=女性)

這樣我們就得到了一個問題的2種答案,也就是2種假設(Hypothesis):

H0:男性<=女性

H1:男性>女性

我們把自己預先判斷的答案叫做H1,而我們預先判斷的對立面的答案叫做H0。可以看到H0和H1在邏輯上是完全互補的,也就是說如果我們能證明H0是錯誤的,那麼我們的判斷H1則是正確的!(為什麼不直接證明H1是正確的,這是另一個話題,可以後續再講...)

好了,我們的問題和假設都明確了,下一步要做的事情就是去收集證據去挑戰H0,如果證據表明H0是錯誤的,那麼就可以證明我們的判斷(H1)是正確的了!

Step2,收集證據(p)

收集證據最直白的就是把所有使用頭條的用戶挨個詢問一遍他們的性別,就可以得出問題的答案,但是很顯然這個工作量是無法完成的,我們可以選擇從所有使用頭條的用戶中抽取一部分用戶來收集他們的性別,統計學上認為合理的足夠多的樣本可以代表總體情況

頭條APP有100個用戶(僅舉例),我們從中隨機抽取10個用戶,詢問他們的性別,按照H0假設這個結果應該大概率是5個男性5個女性。而我們的調查結果發現有7個男性,3個女性,出現這種情況的概率是0.113。也就是說在H0(5男5女)的情況下,出現了7男3女的概率是0.113。我們把這個概率叫做p值,而p=0.113

我們也可能會抽取出其他比例的結果,比如如果我們隨機抽取的10個用戶中有9個男性,1個女性,出現這種情況的概率是0.007,也就是說在H0(5男5女)的情況下,出現了9男1女的概率是0.007,即p=0.007

0.007是一個很小的概率值,可以說是小概率事件,小概率事件我們一般認為是不可能發生的,也就是說H0是不可能發生的,這個時候我們就可以得出結論:H0錯誤,從而我們的假設H1是正確的!

那麼到底是出現0.113我們就可以認為是小概率事件,還是說出現了0.007才可以認為是小概率事件呢?

Step3,判斷的標準(α)

承接上一步,當抽樣的結果等於多少的時候我們可以認定是小概率事件呢?也就是說是在我們抽的10個用戶中有7個男性的時候就可以判斷H0是錯誤的,還是說當我們抽的10個用戶中有9個男性的時候,我們才可以判斷H0是錯誤的呢?這個值就是我們的判斷標準,我們把這個標準叫做α!

一般來說統計學上把α定為0.05或0.01。如果我們取α=0.05(即我們做決策的標準),那麼如果在假設H0的情況下我們的抽樣結果的出現概率p<0.05(即α)時,我們就可以認為是出現了小概率事件,即H0是錯誤的!

Step4,得出結論(根據p和α的對比)

好的,現在我們的證據也收集了,判斷標準也定了,把我們的收集的證據p和α做對比,就可以做出結論了!我們可以根據結論明確頭條APP的用戶是怎樣的,可以針對性的做一些符合他們需求的產品決策...

這篇文章就到這裡了(有點暈...),我們下期再見^^


分享到:


相關文章: