數學考15分的錢鍾書出了道計算機題,這些人研究了35年

數學考15分的錢鍾書出了道計算機題,這些人研究了35年

1980年代末,錢鍾書 (左)與欒貴明在錢 鍾書寓所。攝影/楊絳

本刊記者/鮑安琪

在因涉嫌“貪汙罪”取保候審的五年中,欒貴明常常想起錢鍾書1985年夏給他的那封信。

在信中,錢鍾書告誡他,項目做好了,很多人會高興,也有很多人會生氣,他有可能成為眾矢之的。錢鍾書還要他十年之後再來看這封信。

出事時,時間剛好將近十年。

這個項目即“中國古典文獻數據庫”,現在叫“中國古典數字工程”。從1984年錢鍾書佈置這個任務,35年過去,欒貴明和稍後加入的田奕只幹了這一件事,一直到今天。

由於資金缺乏,公司不斷往西搬遷。現在的“掃葉”公司位於北京西南五環外房山區一處名為“掃葉園”的平房院落。“掃葉”之名源於一句行內話:校書如掃落葉。

田奕告訴《中國新聞週刊》,截至目前,已完成從太古時期到北宋之前中國古典文獻的錄入梳理工作,共計十億多字。預計再過5年,可完成1912年之前主要文獻典籍的數字化,工程總計15億字。

忘年交

1964年9月一個週二的上午,在單位6號樓一樓大書庫最後一排書架旁,欒貴明第一次見到了錢鍾書。

當時,欒貴明剛從北京大學中文系古典文獻專業畢業,分配到中國科學院哲學社會科學部(簡稱“學部”,為中國社科院前身)文學研究所。出於大學時代萌生的對錢鍾書的景仰,他一來便到處打聽哪裡可以見到錢鍾書,得到錢鍾書來單位都會到書庫看書的“情報”。

欒貴明記得,錢鍾書當時看的是一部不引人注意的書《叢書集成》。他過去打招呼,簡要地做了自我介紹。令他意外的是,錢對他的家世並不陌生。

欒貴明是世家子弟,外公家曾有很多產業,包括頗有名氣的北京雙合盛啤酒廠,他上高中時就開始協助外婆打理家產。錢鍾書認識他的舅舅、研究茅盾的王積賢。

從那時起,欒貴明常幫錢鍾書做一些瑣事,如從所裡借書、帶信、取工資、報銷醫藥費等,兩人逐漸成了忘年交。

1972年3月,錢鍾書從河南“五七”幹校回京後,開始寫作《管錐編》。他對書籍的需求量很大,

欒貴明用鋼管和鋼板焊了一輛車,為他運書

曾擔任社科院副秘書長的楊潤時說,當時京城世家子弟中有一批“玩家”,欒貴明身上就有這種“玩家”風範。他愛搗鼓半導體收音機、電視機等,雖然外觀簡陋,卻可聽可看;還自學成才,成為學部第一個持有國家頒發的證件的放映員。漸漸地,在上世紀六七十年代的學部,許多人都知道欒貴明是個愛“玩”且能“玩”出一些名堂的人。

數學15分的人出的計算機題

1982年,在胡喬木的力邀下,錢鍾書出任社科院副院長,但條件是不分管行政工作,也不要辦公室和工作人員。

當時,錢鍾書已開始《宋詩紀事》的研究。這是一部清代人整理的宋代詩集,他計劃在其作者厲鶚的基礎上修正補足,形成《宋詩紀事補正》。在他的指導下,欒貴明利用下班後的時間,進行具體編輯與整理。

做了兩年,欒貴明發現,這項工作需要做宋代3800多位詩人的補遺工作,工程量巨大。比如在一處發現了某一句詩,就要人工拿這句詩到這位作者的作品集裡去查。作品少還好辦,像陸游有一萬多首詩,查找起來就很困難。錢鍾書對工作的進展很不滿意,時常說做得“太單薄”。欒貴明提出從所裡增加兩個人過來一起做,但被拒絕。

1984年的一天,他去錢鍾書家時,錢鍾書告訴他,給他找了一個“好工具”:計算機。他問,什麼叫計算機?錢鍾書把女兒錢瑗叫了過來,錢瑗開玩笑地說:“什麼機密都透露給別人。”

原來,錢瑗不久前才從英國做訪問學者回國,有次向錢鍾書提起,英國學者在用計算機輔助研究莎士比亞戲劇。這讓錢鍾書想到,中國也可以用計算機來研究古籍。

他讓欒貴明放下手邊的工作,先研究計算機,還當場拿出8000元交給他。當時錢鍾書每月工資為365元,楊絳的工資稍少一些。

欒貴明說,錢鍾書跟他說的事,在他那裡從不過夜。他從錢鍾書位於北京西三環南沙溝的家出來,就騎車沿著三環一路尋找哪裡有計算機賣。

也巧了,騎到東三環,在人民日報社附近的路口,他看到保定計算機廠正在舉辦一個小規模的計算機展銷會,就進去細問了半天,並留下了聯繫方式。當晚他到家時,廠家的推銷人員已經坐在他家樓梯上等著了。

雙方達成協議,計算機可以先免費試用。那時還沒有PC機,這是一臺蘋果機,硬盤只有10兆,售價五六萬元,就放在他家裡。

欒貴明向錢鍾書報告借到了計算機,並把8000元還了回去。他把計算機說明書給錢鍾書看,錢鍾書嫌中文翻譯得不好,直接讀的英文原文。

欒貴明回憶,社科院很多人都有過疑惑,說錢先生一個數學只考15分的人怎麼可能想出一個關於計算機的項目?欒貴明說,真正做過文獻整理的人,太知道計算機是可以幫助他的。

1984年至1985年間,欒貴明自己買書,自學了計算機basic語言。因為錢鍾書說,不會德文怎麼研究馬克思主義,不會文言文怎麼研究中國古典文化?計算機技術如同工具,不能找別人幫忙,必須自己學。

在他對計算機漸漸摸索出門道後,錢鍾書佈置他,用計算機錄入《論語》。

欒貴明告訴《中國新聞週刊》,一開始並不知道計算機可以用來做《宋詩紀事補正》,後來隨著錄入文獻的增多,才有了條件做這件事,這是一個逐步認識的過程。但利用計算機研究中國古典文獻,有一些文獻是一定要錄入的,《論語》就是其一。

搞電腦的一個大問題是燒錢。存儲代碼的軟盤一張30元,性能不穩,很容易損壞。電費也成為每月的大額支出。欒貴明一個月工資60元,時常感到經濟上的壓力。

雖然他都是利用晚上時間在家做,但文學所的同事漸漸聽說了,有時會拜託他查找《論語》的資料。

1985年夏天,時任文學所所長的劉再復和黨委書記朱寨一同來到欒貴明家中,一再勸說他把這個項目轉到所裡,作為所裡的計算機室。欒貴明給錢鍾書打電話,錢鍾書讓他答應了吧,還開玩笑說:“你背叛了我。”

隔了一天,欒貴明在院裡收到錢鍾書給他的信。這就是那封讓他十年後再重看的信。

信中寫道:“昨得電話,我為你欣興,我當初對你說此事若你一個人幹,能力不夠,拼了命亦難如願。此事若出官,一定不讓你帶頭,只讓你鑲邊,你得把你辛苦得來的一些積累交公。果然不出我所料,因為你的牌子不夠領銜,而這樁買賣又是大好招牌,你和我一樣只是親自動手的小工,不是組織人事、支配財務、發號運籌的大帥。我已修行多年,可以掛名,你還得當苦力呢。”

錢鍾書親自為這個項目命名為“中國古典文獻數據庫”。

所裡把社科院大樓一層的一個房間撥給欒貴明,作為計算機室的辦公用房。從保定計算機廠借的電腦,也由所裡支付購買,並添了設備。

計算機室開始招兵買馬。第一批14人,幾乎都是高中畢業生,並非社科院正式職工,開始時連合同工都算不上,只是“學員”。

整個計算機室沒有一個計算機專業畢業生,都是欒貴明帶頭研究,計算機室的人跟著學。欒貴明幾乎吃住在計算機室,曾經在計算機前連續工作40多個小時,以致手足僵直,最後只能被人從椅子上抬下來,放到床上休息。

錢鍾書還親自為欒貴明挑選了一位助手。

1986年初春的一個上午,他和楊絳一起來到計算機室,讓欒貴明把新招的學員找來,與他們分別談話。當晚,他向欒貴明描述了一個學員的外貌和衣著特徵。這個學員就是田奕。

田奕高中畢業時由於生病,沒有參加成高考,在社會上打零工。當時《光明日報》辦了一個十天左右的計算機培訓班,她出於興趣前去聽課。欒貴明也被請來在這個班上授課,她從而得知了社科院的計算機室在招人的消息。

田奕向《中國新聞週刊》回憶,當天錢鍾書一身英國紳士打扮,戴一條白色圍巾。時至今日,她仍然清楚地記得兩件事。一是握手時,錢鍾書的手像麵條一樣軟。她後來常去錢鍾書家,與錢鍾書和楊絳漸漸熟悉,楊絳開玩笑說這是由於錢鍾書“十指不沾陽春水”。

二是錢鍾書的皮鞋特別好看,是棕色的,上面還有花紋,泛著皮革自帶的光澤。田奕後來知道這是錢瑗在意大利給他買的。錢鍾書逝世後,楊絳特意把這雙皮鞋贈給她留作紀念。

談話時,楊絳沒有說話,都是錢鍾書在問問題。談話內容田奕不記得了,只記得很快就談完了。

錢鍾書告訴欒貴明的是:“聰明的孩子容易不可靠,可靠的孩子容易不聰明,這兩個優點她都有,她會幫咱們把這個項目完成的。”

“你們是裁縫,不是外科醫生”

錢鍾書不肯擔任任何單位的“顧問”,唯獨計算機室例外。他戲稱,計算機室的年輕人是他的“孩兒們”。

他來院裡開會,常常先到計算機室落腳。每年過生日收到很多蛋糕和鮮花,都叫出租車送來計算機室,或讓學生去他家取,鮮花插瓶,蛋糕分吃掉。

研究規範、規劃和方案,都是錢鍾書親自制訂的。

80年代中期,使用繁體字是一個敏感的事情,但錢鍾書要求他們尊重著作原貌,必須使用繁體字。

先前錄入《論語》時,欒貴明使用的是計算機自帶的輸入法,缺字嚴重。他們蒐羅了近十個中文輸入系統的資料,請錢鍾書選定,錢鍾書敲定了臺灣的朱邦復創制的“倉頡輸入法”。

這種輸入法以字首筆作為分類,字身作為補充,可以隨時添加新字。錢鍾書給了欒貴明一萬餘元,購買了倉頡輸入法硬卡。到現在,“中國古典數字工程”一直在使用這種輸入法。

在倉頡輸入法的框架下,他們研製出了有近3萬漢字並具有繁體字自動生成功能的“全漢字庫”。

錢鍾書要求,數據庫僅收錄中華民國建立之前的古籍。他提出,打破經史子集的傳統分類,用作者統攬作品,這在古籍整理領域是一種創舉。

他還親自指定了錄入所使用的文獻底本。他認為,受時代侷限和政治考量的影響,乾隆年間完成的文淵閣本《四庫全書》有很多不準確和遺漏之處,因此要避免採用。在《全唐詩》版本的選擇上,他指定使用乾隆年間江南詩局的原刊本。

在《史記》版本的選擇上,則使用張元濟編的百衲本中的宋本。錢鍾書認為這些版本收錄全面,也更準確,同時能避免侵中華書局的權。而當時社會上普遍還沒有版權意識,《中華人民共和國著作權法》要到1990年才首次頒佈。

慎用現代漢語中的標點符號,正文和後人的註釋不得混淆,也是一大規範。錢鍾書告誡研究小組:“你們是裁縫,只能是量體裁衣,不能做外科醫生。”

1986年,欒貴明和團隊返工重新錄入了一遍《論語》。第一部使用電腦編制的《論語數據庫》於1987年由人民日報出版社正式出版,錢鍾書題寫了書名。

錢鍾書為欒貴明修改該書“前言”時,寫下一段評論:“有了紙墨筆硯‘文房四寶’,準還有人用刀筆和竹簡;有了汽車、飛機、電報電話,也還有不惜體力和時間的保守者。對新事物的抗拒是歷史上常有的現象,抗拒新事物到頭來的失敗也是歷史常給人的教訓。”

根據先“文”(《論語》)、後“詩”、再“經”的順序,錢鍾書給研究小組佈置的第二項任務是《全唐詩》。

比起《論語》,《全唐詩》可謂浩如煙海,需要增加設備和錄入人員,這些都需要經費。欒貴明找所裡,所裡解決不了;找院裡,院裡也不能立項。他一遍遍跑院科研局,局長王煥宇下決心冒一次風險,同意從院科研經費中撥出10萬元,以借款方式給欒貴明,並約定了還款時間。

研究小組花了近三年時間,錄入了27冊《全唐詩》的全部正文、異文、補遺和註文,經11次校對,於1988年發佈了《全唐詩數據庫》。

通過運算,《全唐詩數據庫》判定全唐詩共有53035首、作者3276位,訂正了4萬多首和兩千多人的傳統說法。

1988年10月的一天,欒貴明到院辦公室找當時分管人事的社科院副秘書長兼新聞發言人楊潤時,請求以新聞發佈會形式向社會公佈《全唐詩數據庫》成果。並說明,此前曾向院科研局借款10萬元,計算機室現有設備足可抵頂這10萬元,要求以實物還賬,然後把計算機室人員遣散。

楊潤時聽後,覺得“借款搞科研”在中國社會科學院聞所未聞,也不合規,“拆廟還債”更令人啼笑皆非,表示要先了解情況再說。

經過調查,他核實了欒貴明所說的情況,感到現在的關鍵是要對《全唐詩數據庫》作出評估。他向時任社科院院長鬍繩和常務副院長丁偉志報告後,邀請中科院計算所的專家和古典文獻研究方面的學者,組織了評估會。

評估會上,一位紅學家要求當場檢索《全唐詩》中有沒有出現過“紅樓夢”一詞、出現過幾次。兩分鐘後,計算機給出答案:總字數達340餘萬字的《全唐詩》中,“紅樓夢”曾在472卷中蔡京的《詠子規》出現:“凝成紫塞風前淚,驚破紅樓夢裡心。”

有老學者興奮地說,做學術研究時,查書抄卡片是件很辛苦的事,所以常有“皓首窮經”的感慨。有了這種數據庫,等於大大延長了科研人員的學術生命。大家認為,如果數據庫廣泛應用,社會科學研究在手段、工具、方式等方面會發生革命性變化。

1989年3月下旬,“中國古典文獻計算機處理技術成果”新聞發佈會在社科院學術報告廳舉行,各大媒體都發了消息。按照錢鍾書的要求,他與數據庫的關係完全未被提及,他也沒有對數據庫作出公開評論。楊潤時後來猜想,那是為了避免把關注的目光轉移到他的身上。

直到兩個月後,錢鍾書才給楊潤時寫了一封信,對這一“可喜的成果”表示祝賀,對院領導的支持表示感謝。信中寫道:“作為一個對《全唐詩》有興趣的人,我經常感到尋檢詞句的困難,對於這個成果提供的絕大便利,更有由衷的欣悅。這是人工知能在中國古典文學研究上的重要貢獻。”

5月下旬,在院長鬍繩的主持下,社科院初步議定,把當時屬於文學研究所的計算機室改建為院計算機室,同時把這一項目確立為院重點科研項目。

那段時間,計算機室上電視,參加廣交會,被海外媒體報道。1990年,“中國古典文獻計算機處理技術”被授予國家科技進步三等獎,這是社科院的人文學科研究成果第一次獲此獎項,是一個非常有分量的獎項。

楊潤時告訴《中國新聞週刊》,在80年代,“三論”(控制論、系統論、信息論)可說是一種學術時尚。胡喬木擔任社科院院長時就作過指示,鼓勵用“三論”豐富和改進社會科學研究方法。因此,社科院領導對這個項目一直是支持的。1989年清查考察小組進駐後,對項目的支持也沒有改變。

1990年底,中國社會科學院計算機室正式組建,欒貴明為該室主任。田奕以《全宋詞數據庫》的研究通過了論文答辯,獲得社科院中文系古典專業碩士學位。一直在計算機室工作的17名學員陸續轉為了社科院正式職工,在轉正名額極少的情況下,令社科院各處室感到“震動”。

那陣子,小小計算機室天天洋溢著過節的氣氛。沒有人能想到,一場滅頂之災正向他們撲來。

  

“我把欒貴明託付給你了”

社科院計算機室組建後,院裡加大了投入,撥付了數額較大的經費。欒貴明不滿於個別領導在購買設備等事情上有侵佔行為,忍不住跟錢鍾書提起,錢鍾書嚴命他如實向院領導彙報,並親自起草了舉報信底稿。

數學考15分的錢鍾書出了道計算機題,這些人研究了35年

1988年,田奕(左四)等在 社科院文學所計算機室。 圖/受訪者提供


楊潤時提起這事,深為欒貴明沒有事先告知他而遺憾。他感慨,欒貴明是一塊硬骨頭,但缺乏一點必要的變通;錢鍾書是一位大學問家,同時也書生氣十足。

錢鍾書和欒貴明意識不到的是,在當時的環境下,舉報被認為是別有用心的,是對著清查考察小組而來的。社科院隨即開展了財務大檢查,計算機室被列為重點查處對象。

每一筆錢都被攤開來審查。1992年8月,上海教育出版社出版了署名為周振甫、冀勤編著的《錢鍾書〈談藝錄〉讀本》。錢鍾書不滿自己的作品被任意出版,不想要稿費,但退又退不回去,就把現金放在一個信封裡,寫上“中國社會科學院計算機室主任欒貴明收”,由計算機室一個工作人員取去。

欒貴明大致記得是幾千塊,但具體多少他沒過問,說不出準確數字來。查賬的人質疑,錢鍾書的稿費一定多於賬目上的金額,是不是欒貴明個人貪汙了?但找不出證據。

院內財務檢查沒有查出問題,又從外面找會計師事務所來查,仍然查不出來,最後動用了司法的力量。

1993年七八月間的一天,欒貴明和田奕突然被北京市東城區檢察院傳喚。計算機室被徹底搜查,書籍、軟件、現金、存摺等一應物品被扣押,欒貴明和田奕也在接受傳訊後被取保候審。

9月,楊潤時調往最高人民法院,擔任最高院研究室主任(後擔任了最高院審判委員會委員)。年底,獲知錢鍾書因腎病做手術後在北京醫院住院,他即去探望。

兩人交談了半個多小時。錢鍾書興致很高,但楊潤時怕打擾太久,遂起身告別。錢鍾書從沙發上站起來,拉著他的手神色凝重地說:“欒貴明的事情我管不動了。我把欒貴明託付給你了。”聽到這樣的話,楊潤時心血上湧,竟一時語塞。

走到病房門口,錢鍾書又拉住他的手,一字一句地說:“我把欒貴明託付給你了。來,我們擁抱一下告別。”

楊絳送楊潤時出去時感慨:“鍾書很少用這種方式與人告別,今天我都有點意外,他這真是對你鄭重囑託啊。”

楊潤時沒有忘記錢鍾書這份沉重的囑託。在辦案期間,他以知情者的身份詳實介紹了自己所經手部分的來龍去脈。他鄭重表示:如果把一個無罪的人搞成有罪,這個後果將是很嚴重的。

最終,1998年5月中旬,法院下達了無罪判決書。

欒貴明趕到北京醫院,把這個消息告訴了錢鍾書。錢鍾書自1997年夏手術後失語,聽到這個判決結果時,流下了眼淚。

1998年10月,錢鍾書在醫院病床上過完了八十八歲米壽,兩個月後去世。

也是在判決書下達後,剛從社科院院長任上退下來的胡繩把楊潤時找到家中。他說,他一直關注著此事,但限於當時的情況(胡繩1990年後不再擔任社科院黨組書記一職),不便發表意見,現在真相清楚了,法院有判決了,應當總結一下這件事的教訓。

胡繩還說,得知欒貴明申請提前退休受阻後,他給社科院主持工作的領導寫了一封信,大意是,欒貴明及計算機室一案是他任院長期間院內發生的一起最突出的冤案,心頗為之不安,希望准予並處理好欒貴明退休的事,如有牽連的人也望妥善處理。

楊潤時說,自己從擔任社科院辦公廳主任到副秘書長,在胡繩身邊工作了九年多,還從未聽到他用這樣沉重的語言評價一件涉及知識分子政策的個案。

2000年7月,欒貴明終於被批准提前退休,田奕也辦理了退職手續,兩人分別受到了行政記過和行政記大過的處分。

曾經紅紅火火的社科院計算機室就此作鳥獸散。

掃葉都淨

在社科院期間,“中國古典文獻數據庫”項目吸引了一些海內外學者的密切關注,不斷有人表示願意提供經費支持或進行合作,其中就有“倉頡輸入法”的發明者朱邦復。

在朱邦復的牽線搭橋和香港文化傳信集團主席張偉東的邀請下,研究小組進入香港文化傳信集團,項目也更名為“中國古典數字工程”。

《宋詩紀事補正》也終於在1999年3月出版,楊絳為這部書題寫了書名。

2007年,香港文化傳信集團高層發生人事變動,新任董事會決定不再繼續出資支持這一工程,欒貴明和田奕不得不離開集團。

二人共同自籌10萬元,在2007年成立了“北京掃葉科技文化公司”,田奕為法人,欒貴明為股東。

掃葉公司出的每本書中,都印有錢鍾書在《管錐編》序中的幾句話:“拾穗靡遺,掃葉都淨,網羅理董,俾求全徵獻,名實相符,猶有待於不恥支離事業之學士焉。”

欒貴明認為,這就是錢鍾書的文化態度:中國文化是由眾多個體共同建立起來的,這些人的作品散落在典籍的各個角落裡,猶如落葉;整理古籍就是要把這些碎片收集起來,如掃落葉,不能有遺。

公司辦公室是田奕帶領員工自行設計蓋起的,像一座農家小院,樹木茂密,花園中栽滿了朋友送的各式月季,其中不乏珍貴品種。書房裡存放著錢鍾書的親筆手稿、書法、信件。圍牆低矮,還養狗以防盜。

田奕曾想過各種辦法“開源節流”。公司曾養過一千隻雞,每日賣雞蛋,銷路很好。

近期,由於公司所使用的土地被規劃為綠化用地,公司面臨著又一次搬遷。

掃葉公司顧問範業強和寒小風等人長期協助田奕進行公司運營。他們向《中國新聞週刊》透露,公司今年夏天得到來自南京一家企業的投資,實力將大大增強。

這個中國典籍的基礎性工程已逐漸成形,包括錢鍾書提出的“四大庫”(人名庫、地名庫、日曆庫和作品庫)以及團隊後來開發的“五附加庫”(工具庫、圖片庫、地圖庫、類書收藏庫和數據彙編庫)。其中,“日曆庫”逐日編輯了中國五千多年曆史的每一天,標註帝號、年、干支,及其對應的公元年月日等。

作為成果之一的《中國古典數字工程叢書》,2013年起由新世界出版社出版。新世界出版社編委會副主任張世林告訴《中國新聞週刊》,出版社看中的正是書稿中很多內容屬於首次披露這一特點。

他舉《老子集》為例。人們只知道老子的《道德經》,全文五千言,而《老子集》收錄的老子言論多達六七萬言,多出來的就是利用計算機技術從海量古籍中收集、整理而來的。

目前數據庫還未對公眾開放,除推出出版物外,僅為一些高層次研究者提供資料查詢便利。北京市社會科學院歷史研究所研究員、文獻學家鍾少華就是一位免費用戶。他告訴《中國新聞週刊》,這個數據庫內容的準確度是目前所有古籍數據庫中最令人放心的。

田奕認為,將來商業化是一定的,但首先要有良好的合作伙伴和商業模式。“錢先生對我們的影響就是,待在我們這個院裡的年輕人都能靜下心來,不受外界誘惑地做這麼辛苦的事,這很不簡單。”

欒貴明說:“錢先生曾對我說:我該說的都說了,不能陪你們到底了,你們將來會遇到很多困難,但是遇到困難時你們總能想到解決問題的辦法,也自然會有天兵天將來助你們。”

他說,錢鍾書交待的這個活兒確實是一件累活,但他必須遵命,用餘生把這個作業完成。


分享到:


相關文章: