我讀︱《官紳的荷包》:如何做好的量化歷史研究?

十年磨一劍。中國社科院近代史研究所云妍副研究員與中國人民大學歷史學系林展博士、香港大學經濟與工商管理學院陳志武教授合作的《官員的荷包——清代精英家庭資產結構研究》(後文簡稱《官紳的荷包》)一書,歷時十年,在2019年歲末由中信出版社出版了。就選題而言,官紳群體家庭資產的系統研究在清史中尚不多見,該書為理解清代社會的階層分化和中上層經濟生活提供了新看法。同時,對一些家喻戶曉的“名官大貪”,如年羹堯、和紳等真實家資規模的再討論本身也充滿了話題性。就方法而論,該書以構建官紳資產數據庫為基礎,以量化研究為主要手段。量化歷史數據庫的構建與研究,是當前學界前沿性的新方法。

量化歷史研究的優勢在於整合大規模系統史料,提供新的歷史發現,但在具體操作上,對材料和方法又有著很多要求,開展起來並不容易。最近幾年來,雖然量化歷史研究與數字人文、數字史學等概念、提法有日漸火熱之勢,但真正成功和有廣泛學術影響的研究並不多見。這種反差加深了許多學者對這一方法的困惑:量化歷史研究是否能夠在歷史學界推廣?如果是,又該如何做?在閱讀了《官紳的荷包》一書後,個人覺得或許可以這一新著為例,從問題、材料、方法和研究者等最核心的要素出發,在討論此書特點與價值的同時,嘗試回應這樣的疑問。

一、問題和材料的選擇

一項量化史學研究要想取得廣泛的影響,首先必須有一個高學術價值的研究問題,研究的是深入理解某種社會結構或群體行為的關鍵環節,是無論擅長哪種研究方法的學者都能理解和必需回答的問題。《官紳的荷包》一書,以官紳家庭資產為研究選題,即兼具很高的社會關注度和重要學術價值。

近些年中國的反腐大潮,使得官員家庭資產成了社會性話題,是一個高關注度的“顯題”。在學術領域,貧富差距大、社會不平等是全球所有國家都面臨的共同困境,也是學術研究的核心議題。對中國社會而言,要理解不平等形成的原因、機制等,就必須深刻思考家庭資產積累的形成以及其中財產權利與政治權力的互動與角力。研究官紳群體的家庭資產規模和結構,能直接反映社會財富的分配模式與社會階層差異,可以從側面展示社會經濟的特點與發展階段,學術價值可謂“顯要”。

越重要的研究問題往往難度也越大,家庭資產研究便是如此。決定個人社會階層屬性最重要的指標,通常包括財富、職業與教育水平等等。但幾乎在所有的國家和社會中,家庭財富信息都是其中最不公開,最難以獲得的信息。而且越是社會上層,獲得可靠信息的難度也越大,這給研究帶來了巨大挑戰。對於當代社會,學者們會採用納稅或公開的工資收入代替財富。但工資往往只反映個人的部分收入,不能全面反映家庭資產,這種不足對官員家庭資產的研究可能更為致命。因此,雖然像臺灣學者賴惠敏曾利用內務府檔案研究過清代皇族的經濟收入,但史學界對官紳家庭資產的研究並不充分,這也反過來凸現了《官紳的荷包》一書選題的價值。

要完成一項成功的量化歷史研究,是否有足夠有效的材料能保證研究是更為關鍵的問題。實際上,任何史學研究都應該是以史料為中心,以儘可能多的獲取史料為前提的。量化研究對史料的要求一樣是苛刻的,材料不僅要有一定的數量,還需有一定的質量(內容),才能實現研究的目的。《官紳的荷包》作為一項成功的量化史學研究,充分地體現了這樣的研究路徑:官方保存的抄家檔案是難得的有效理解官紳家庭資產的材料,是本書能夠成功的保證。

清代官員的抄家檔案具有規模大,連續性強和保存好的特點。民間社會雖然也廣泛存在記載家庭資產的“分家書”等文書,但過於零散,沒有系統整理幾乎無法為研究使用。此外,抄家檔案不僅覆蓋的對象範圍廣,全國各地官員都有涉及,而且涵蓋的時代長,清前、中、後期各朝都有。雲妍此前關於抄家的研究還表明,被抄家的官紳,絕不都是“貪官汙吏”,有相當多是政治鬥爭的犧牲品,如文字獄等。官員之外還包括一些幕友和地方紳士,如雲南布政使錢度幕中的葉士元,文字獄中的江西舉人王錫侯等。這大為提升了研究樣本的代表性。

抄家檔案的內容更是珍貴,具有很高的學術價值。它們非常全面地“窮盡”了被抄家者的全部家庭財產,大到田地房產,小到日常用品,一般都有細緻的具體記錄。有些家產清單中還留有當時的原始估價,這種完整性和詳細度是分家書、私人日記及人物傳記等其他資料無法達到的。正是因為有了這樣的核心資料,《官紳的荷包》一書才能夠既展現出很多生動的具體案例,又能實現系統的多變量量化分析。因此,能否獲取具備一定規模、時間長度和群體代表性的史料,是能否成功的完成一項量化史學研究的前提和基礎。

我讀︱《官紳的荷包》:如何做好的量化歷史研究?

《官紳的荷包:清代精英家庭資產結構研究》,雲妍、[美] 陳志武、林展著, 中信出版集團2019年11月出版

二、方法與表述的使用

手握可靠的資料和好的選題,一項量化研究看似成功在望,但絕非唾手可得,如何合理有效地運用研究方法是下一個關鍵。很多人會認為,量化研究的項目在方法上一定要追求最高明、最前沿的計算工具或分析模型,凸現“技術”的能力。但《官紳的荷包》一書在研究方法上最值得讚許的,恰恰是不過分迷戀各類高級分析工具,而是突出以史料為中心,利用各種手段和方法實現史料收集範圍的最大化,努力對不同主題數據庫的信息進行連接和結果互證,在平衡定性描述與定量分析方法的同時,讓史料更好地服務研究問題。

量化研究論著給人的印象常常是過於專注數據計算和各類圖表呈現,乾巴巴的公式和結構較多,對歷史進程中具體而豐滿的人物和事件的描述少,可讀性不強,只服務於專家同行,而將大量的普通讀者拋在一邊。《官紳的荷包》則不同,該書分上、下兩篇。上篇是描述性的“案例篇”,對研究樣本中有典型意義的案例進行具體描述,以家產資料的解讀和家產的追蹤復原為中心,貫穿以必要的案情敘述。其中對和紳、年羹堯等家庭資產的描述,如破案般抽絲剝繭,層層遞進,不斷呈現出新數據,引人入勝,令人有很好的閱讀體驗。雖然量化研究的基礎是數據,但有學者指出:“數據”兩個字有著量化的微弱氣息,把過往豐富的人生經驗直接降維成一些數字。因此,量化研究不能排斥定性描述。實際上,數據並非數字,而是“信息”。信息的串聯、集合,可以用於統計,也可以用於描述。《官紳的荷包》開篇不是公式加計算,而是案例描述,著實令人耳目一新。

下篇“量化分析篇”則是定量分析,通過對上篇185個官紳家庭資產案例的數據彙總和分析,探討清代官紳階層家產結構的總體性特徵,發現了一些有趣且重要的新現象。如在清代官紳家庭資產中,金融業類資產比重不低,同時各種貴重實物佔據相當的份額,這與過去認為的官紳家庭財產以田地、房屋為主的認識很不同。又如發現官員家產非法性程度越高,其持有土地資產的比重越低,持有隱匿性更強的金融商業資產比重越高。這些結論是具有很強衝擊力的,可以幫助學界重新認識傳統時代官紳家庭的資產組成及其特點。

三、數據與人員的連接

量化數據庫的建設與研究,還需要強調史料數據的連接與研究人員的連接。所謂史料數據的連接,包括“內連接”與“外連接”兩方面。“內連接”是指一方面,某一數據庫在建設時力爭利用多來源史料中能相互匹配的信息進行連接以擴充數據庫內容;另一方面,在利用某一數據庫進行研究時,應注意其中信息的相互連接,以拉長研究的時段、代際或空間範圍等。“外連接”主要指不同主題但內容等具有連接可能的數據庫,在開放的前提下,實現相關數據信息的連接,突破單一主題數據庫信息範圍與廣度上的侷限,實現數據庫建設與研究的“共享”與“共贏”。數據的“內連接”與“外連接”,一個最要的目的就是使存儲於數據庫中的相關信息逐步從靜態走向“追蹤”,即通過多種材料或數據庫的互相連接,連綴起某個個人和某些群體不同時間節點的信息,形成一種“追蹤數據”,使得某些歷史上個人的經歷能夠豐富和連續得呈現出。

在很好地平衡定性描述與定量分析之外,《官紳的荷包》的作者們很好地開展了不同來源史料(包括歷史數據庫)的連接,儘可能地完善數據的內容和覆蓋面,提升研究結論的可靠性。

如作者發現很多人物家產資料不完整或無法一次性找全,案例人物的背景信息(官職、籍貫、履歷等)同樣需要蒐集彙總。於是他們充分利用互聯網資源,將不同時空、不同出處的史料有效集中起來,形成相對完整的內容拼接。如雍正元年登州知府李元龍被抄,家產資料中並沒有田產記錄,但通過網上資料搜尋,在北京碑刻資料中發現了李元龍的田產信息。在完善官紳家產信息數據庫的同時,作者特別注意與一些主題接近的相關數據庫進行連接或結論互證、補證。如陳志武、林展等構建的“歷史中國吏治數據庫”,是基於《二十五史》和明清實錄裡面皇帝懲罰官員的記錄建立的。《官紳的荷包》根據這一數據庫計算了官員被懲罰的次數,以此作為官員被懲罰概率的數據以理解為官的風險。香港科技大學李中清-康文林團隊構建的“清代縉紳錄量化數據庫”,其數據信息與本書研究內容相關性很高,作者也部分利用了這一數據庫來補充自身數據。

《官紳的荷包》一書表明,從技術和研究實踐角度看,充分利用技術方法進行電子化史料信息的連接、追蹤的努力是非常必要的,哪怕只依靠最基礎的方法,這些連接、追蹤依然對提升研究質量幫助甚大。實際上,史料連接、追蹤本就是史料考訂、史實發現的應有之意,是今後開展量化研究必須更為關注的方向。過去學界多認為利用數據庫進行史學研究,最重要的優點是對史料的大規模使用,能夠“廣”而“全”地使用史料。現在隨著越來越多的數據庫被建設起來並向學界開放,數據庫數據的“連接”可能大為增加,“數據追蹤”將越來越成為數據庫研究的重要方法。數據庫研究不僅能夠“廣”而“全”,也能夠“專”且“深”。

數據連接之外,《官紳的荷包》一書的成功還在於研究者的“連接”,即組建了一個有分工、有實力的研究團隊。一般來說,大規模量化歷史研究項目往往是跨學科的,歷史資料的收集與考證,量化方法的選擇與使用,量化結果的研究與描述等會涉及到歷史、統計和相關社會科學等多個專業領域,需要建立一直各有所長的研究團隊,這與傳統史學研究主要是“單打獨鬥”的個人研究有所不同。《官紳的荷包》作者中,陳志武教授出身金融學界,對複雜的數據分析很有心得,多年來也一直在倡導量化史學研究,對把握項目研究方向和獲取資金支持等都可能很關鍵,雲妍副研究員有著紮實的經濟學學習基礎和長期的史學研究經歷,是研究第一負責人,年輕的經濟學博士林展,對很多具體的計算分析可以做出貢獻。這樣的團隊組合展示了量化史學研究團隊化的要求。

近年來在網絡數字技術發展的支持下,學界逐步形成以建設大規模量化歷史數據庫為基礎的史學研究新風氣,並逐步影響到中國史研究和進入中國學界。從全球學界來看,一些有影響力的中國史學量化研究團隊開始出現,包括香港科技大學的李中清-康文林團隊,香港大學龔啟聖教授團隊以及香港大學陳志武教授團隊。這些團隊都是在資深教授領導下,包括年輕教員、博士後以及研究生組成。

四、“大樣本”與“偏差”

量化歷史數據庫的建設與研究,雖有方興未艾之勢,但畢竟是探索中的新事物。一方面,學者們有必要對各項具體研究中形成的方法和心得及時地進行總結、展示;另一方面,新方法、新嘗試的不成熟之處,也需要學界的同仁一起來討論。《官紳的荷包》在取得突破的同時,個人覺得也有些不夠成熟或令我疑惑的地方。

比如本書是基於185個官紳抄家案例進行的量化研究,研究者稱之為“大樣本”。但無論針對全體清代官員,還是所有被抄家的官紳,這一比例都很低,與一般理解的“大樣本”、“全樣本”概念似乎並不相符。作者能否稱之為“大樣本”?在量化歷史研究中,又該如何具體的定義“大樣本”?作者似乎應該做出必要的說明。

還有一些研究案例,研究材料可能存在掌握不夠充分的問題。如有一些官紳完全沒有田產記錄,作者據此認定沒有此類資產。在傳統中國社會家族和城鄉關係體系之下,官紳家庭沒有任何田產,似乎很難令人信服,應該需要作者們繼續深入發掘資料,簡單作為無田產處理可能會造成量化結果的偏差。

當然,瑕不掩瑜,《官紳的荷包》總體上是一項非常成功的量化歷史研究。期待在這些好的研究示範和鼓勵之下,中國學術界能夠出現越來越多有影響的量化史學研究。


分享到:


相關文章: