今天先總結一下馬光榮老師 關於“經濟學實證研究中常見的40個誤區”的講座。大家之前可能在其他地方見過關於經濟學研究誤區的文章,但是其總結遠不如馬老師的細緻與全面。下面我將列示這40個誤區,並附上一點自己的理解。
1. 不學理論
理論的高度決定研究的高度;講清楚機制需要理論;從目前頂級期刊的發表出發,兼有理論和實證的文章更有優勢。
2. 取法於下,讀太多B類雜誌
有一句話總結得很好:取法於上,僅得為中;取法於中,故為其下;取法於下,則無所得矣。
3. “廣”與“專”的關係沒處理好
由於人(主要是指我們這些普通人,薩繆爾森等少量全才除外)的精力有限,因此我們需要的是廣泛訓練以及專業研究,要有所為有所不為。
4. 操之過急
想到一個idea後,要多思考一段時間,不要太著急去看文獻,避免自己的想法被既有的文獻觀點所佔據。
5. 樣本不夠大
根據大數定律,樣本量越大,越有可能發現規律。很多時候我們得到了一個不顯著的結果,不一定是影響真的不存在,而有可能是樣本量太少了。
6. 樣本不夠長
這一點主要是針對面板數據。以現在流行的政策評估為例,政策效應可能具有一定的滯後性,如果樣本期間太短,根本體現不出來。
7. 慎用國外數據
對於非金融領域的研究,一定要慎用國外數據,不是說不行,而是我們對國外所知甚少,不清楚 別人的制度背景,不清楚數據生成過程,很容易出問題。
8. 不熟悉數據庫
對於自己所使用的數據庫,一定要有細緻全面的瞭解。
9. 不描述數據
這一點我尤其贊同,很多人從來不做描述性統計就直接去跑回歸,得到的結果如何讓人信服?描述數據可以發現潛在的錯誤、極端值、變量的缺失值,以及變量的variation等等。
10. stata手冊式學習
我們不要做紙上談兵的趙括,以為看了幾本參考書就會操作了,stata儘管容易上手,但多用多練習才能真正掌握。
11. 不去研究help file
這一點繼續表示贊同。不少人碰到個命令不會就開始到處問人,這樣無助於深入理解這個命令, 要多看看help file,看看裡面的描述和舉例。
12. 不寫do file
這一點應該多是新手犯的毛病。
13. do file不夠細緻
這一點沒什麼多說的。
14. 不重視識別
實證研究的主要目的就是識別出因果關係,而識別的核心則在於內生性問題的解決。我們在最初選題的時候就應該考慮內生性問題。
15. 不重視穩健性檢驗
穩健性檢驗其實是文章中很重要的一部分,我們應該儘可能把審稿人能想到的都想到。常用的穩健性檢驗方法包括:變換核心解釋變量與被解釋變量,增減控制變量,變換樣本,展示異質性,安慰劑檢驗,驗證機制,排除競爭性假說等等。
16. 依靠PSM和GMM解決內生性
發現越來越多的大佬不用或者不依賴於PSM與GMM,主要原因在於他們對這兩個方法的不信任,可操縱空間太大。其實從最近幾年主流經濟學期刊上的文章也能發現,僅僅用這兩個方法的文章幾乎看不到了。
17. 迷信R-square
這一點我之前已經推文介紹過了。
18. 控制變量選取不當
這裡的選取不當指兩個方面:遺漏變量以及過度控制。過度控制主要是指加入了bad control variable。
19. 標準誤不cluster
在之前的推文裡我講過,如今報告標準誤尤其是穩健標準誤已經成為主流期刊文獻的標準動作。馬老師和其他老師們則進一步強調,穩健標準誤是要的,cluster也是要的,如果不cluster,會導致標準誤有偏,通常高估了顯著性。
20. 只看統計顯著性,不看經濟顯著性
這一點在新手中表現得尤其明顯,看見星星就兩眼放光,但是對經濟顯著性卻視而不見。舉個例 子,假如省直管縣改革對經濟增長三顆星正向顯著,但是其效應只有0.1%甚至更低,我們很難說省直管縣改革在促進經濟增長上影響甚大。
21. 交互項的誤區
之前也強調過,做交互項時,A、B以及A*B三者缺一不可。
22. 衡量指標選取隨意
尤其是對於核心解釋變量,一定要選取常用、乾淨的指標。
23. 不細究核心解釋變量的variation
這一點好像也沒什麼可說的。
24. 用錯虛擬變量
這一點和第18點關於控制變量的選取一樣,過度使用虛擬變量會導致完全共線性,過少使用又會產生遺漏變量問題。
25. 面板數據的誤區—不清楚固定效應下的variation
26. Probit模型的誤區:不報告邊際效應
用Probit、Logit等模型估計出來的係數是不能直接解釋的,需要進行調整。
這一點以後在介紹二值選擇模型時細說。
27. 工具變量的誤區:用錯各種檢驗
這一點在之後關於工具變量的推文裡會詳細介紹。
28.DID的誤區:不做檢驗
這裡的檢驗主要是指共同趨勢檢驗。另,使用DID時,關於分組(區分處理組和對照組)的制度背景要詳細介紹。
29. RD的誤區:被stata命令嚇倒
這一點在以後介紹RD時細說。
30. PSM的誤區:暗箱操作
由於PSM可以暗箱搓作,所以大佬們不怎麼信任PSM的估計結果。大家如果要用PSM,那麼要交代清楚用的是哪種匹配方式,匹配變量是哪些,最好多做幾種匹配方式下的估計,並同時報告OLS的結果。
31. GMM的誤區:暗箱操作
理由同上。大家如果要用GMM,要報告各類檢驗,比如AR(2)、Hansen,並同時報告OLS和FE的結果。
32.做不出結果就放棄
這一點還是在新手中表現明顯。其實,只要迴歸結果符合現實、能夠解釋、能夠服務於故事,即便不顯著也是好結果。用馬老師的話說:不顯著也是可以賣的。
33. 不花時間寫作
寫作是相當重要同時又被大多數人忽視的一部分,據陸銘老師講,他拒掉的很多文章,不是文章內容做的不夠好,而是寫得太差。若是按陳碩老師(論文大悶鍋的創始人)的要求,不說改100遍,10遍總得要吧。
34. 文獻綜述寫作
這一點可以從屬於上一點。
35. 不介紹background,尤其是英文論文。
這一點暫時沒什麼可說的。
36. 實證結果的報告與解釋
要解釋經濟顯著性,解釋每一步穩健性檢驗的必要性,不要為了湊內容而湊內容。
37. 迴歸結果表格不規範,沒有註釋
這個細節大家平時要注意,細節決定成敗。想當初第一次投稿少不更事,審稿人特意寫了一段話來批評表格的不規範,比如迴歸係數的小數點位數要一致等等。
38. 回覆審稿人意見時不禮貌
39. 對於審稿人提出的意見不做修改,反而引述其他人的做法來為自己辯解
40. 對審稿人的回覆太簡短
閱讀更多 融資知識體系 的文章