博士階段解決計量與統計學習問題的幾點經驗

博士階段解決計量與統計學習問題的幾點經驗

模型、變量與方法

明確模型的因變量Y和自變量X分別是什麼,數據結構類型是橫截面還是面板,以便確定具體的研究方法。研究方法的確定一般根據因變量Y的類型來。如橫截面數據,因變量Y是連續性變量,一般用多元線性迴歸;因變量類型是類別變量,那就用logit模型或probit模型。

必要的數據清洗工作

做數據的描述性統計分析看看數據是否存在缺漏值,結合箱圖進一步判斷數據是否存在極端異常值(異方差問題),做做變量間的相關分析矩陣看看變量間相關程度如何(提防多重共線性)。如果存在這些基本問題,需做相應的處理;不存在,繼續往下。

模型的構建與檢驗

模型隱含的假設條件是什麼?這些條件在研究中哪些是滿足的,哪些是不滿足的?還是以橫截面數據的多元線性迴歸為例,學過計量的人都知道,多元線性迴歸要得到無偏一致的估計量,要滿足高斯馬爾科夫定理設定的幾個條件。可逐一對應自己構建的模型,看看條件是否滿足。滿足了繼續往下,不滿足則要做一些必要的檢驗了。如:

1.異方差問題

2.自變量間嚴重的多重共線性問題

3.內生性問題(模型穩健性的檢驗)

其實,很多實證研究出問題就出在這一大點上。因為很多人沒系統的學過計量經濟學,通常拿到數據不做基本的清洗工作,把X,Y帶入模型,就直接跑出結果完事了。然而,計量模型的建構遠沒有想象中那麼簡單。需要注意很多細節的東西。

模型結果的呈現和解讀

迴歸結果要報道哪些檢驗統計量,表格要如何製作,能否直接將軟件跑出來的結果直接整體輸出,怎麼將表格製作的簡單易懂,又能儘可能的展現出迴歸結果的精華,等等。這些都是一些很細節的東西,可在實證研究過程中不斷提升改進的。

其實,計量要解決的本質層面的東西本來就沒有多複雜。只是一個研究,要解決的小問題多了,而有些小問題我們沒接觸過,不知道怎麼處理,這就變得複雜了。所以,綜合而言,系統的學習一下計量的理論知識和軟件實現就顯得非常有必要了。不過,有一點應當引起注意,計量始終是實現研究目標的手段,雖缺少不可,但一篇好文章更重要的可能還是idea的產生過程(即廣泛的閱讀文獻和思考)。一篇文章,計量方法可能有多種,這些方法各自有各自的優劣。在沒有明顯錯誤的情況下,我想雜誌主編更多的還是看文章的idea的

博士階段解決計量與統計學習問題的幾點經驗


分享到:


相關文章: