中国的甲骨文研究到了什么样的程度?还有多少甲骨文没能破解?

北之南兮

甲骨文很古老,但研究甲骨文的甲骨学却很年轻。从1899年发现至今,有一百多年的历史,大量的学者开拓创新,锲而不舍,不断拓宽知识的新边界和历史的深度。

题主同志的问题:「甲骨文研究到了何种程度」?

等于是在问:近一百多年以来,甲骨文研究取得了哪些成果?这就是非常庞大的问题,我推荐你看《甲骨学一百年》这本书。

所以,这里我只能简单的谈一下第二个问题:

甲骨文共有多少字?我们释读出了多少甲骨文?还有多少没有破解?没有被释读的甲骨文难点在哪里?

----------------------------------------------------------------------


第一,甲骨文有多少字?释读出多少字?


徐中舒《甲骨文字典》和董作宾《甲骨学六十年》等著作,中=给出的大约数据是:甲骨文单字约三、四千多字,释读出来一千多字。


李宗焜先生的1995年的博士论文《殷墟甲骨文字表》,经过细致研究得出数据是3815-3954个单字:


李宗馄. (1995). 殷墟甲骨文字表 (Doctoral dissertation, 北京大学古文献研究所博士论文).提要、页330


这个数据和一些学者的猜测是差不多,没有太大出入。


因为不断有新的材料出土,甲骨文单字数量一直都在刷新,根据最新的《新编甲骨文字形总表》,单字序号一直列到了4701(不包括重文):


该书的编者在《后记》部分指出,包括异体重文在内,甲骨文有6000多字,释读出来不到三分之一:


引自:沈建华, & 曹锦炎. (2001). 新编甲骨文字形总表. 中文大学出版社.页176、217


甲骨文怎么样才算被「释读」出来呢?文史不是自然科学或者数学,有明确边界,能定性定量,「释读」其实是不好定义的:


  • 甲骨文释读没有分歧的文字非常少,大部分甲骨文释读分歧非常多,特别是造字本义方面,众说纷纭,莫衷一是。

  • 有很多释读根本被同行不认可,或者说分歧非常大,算不算释读出来?还是算未定呢?

  • 一般来说,释读甲骨文的论文能做到自圆其说,就是姑备一说。释读的难度在于,主流同行的一致认可,能做到大致认可也可以。



那些什么十万元释读甲骨文一个字,懂的人都知道,基本就是一个噱头,没有任何意义。网上有些人动不动就高潮,嘲笑「砖家叫兽去干什么了」,说什么「高手在民间」之类的鬼话,


因为「已释读」无法准确定义,这就给统计带来了难度。所以,学界只能大约估一下:


  • 已经被释读的甲骨文,可能就是一千多字,不到两千字。

  • 这些释读,得到是主流同行认可,分歧不算很大。

  • 即便造字本义和演变过程有分歧,但不影响准确读懂卜辞,或者说影响不大。


那么也就是说:根据最新的统计数据:

甲骨文单字4700字左右(不包括重文),已经释读出来的甲骨文,估算的话上限不到2000。


第二,释读的难点在哪里?


首先,最大难点不用说,肯定是没有流传下来的「死字」。


其次,这些死字大部分都是专有名词,以地名、人名。。。居多,这种专有名词,跟甲骨卜辞中其他的字词没有语义联系,就降低信息的冗余度,无序度增大,可能性变多,很难进行推理。


这该怎么理解呢?我打个简单的比喻:

假设这三个短语中符号是你不认识的古文字,要你联系上下文猜测,猜测难度是依次变大的:



  • 短语1中符号,联系上下文,我们很容易才出来是个「舍」字。

  • 短语2中的符号,联系上下文我们也能猜出来,就是范围要大一点「三心二意,一心一意,尽心尽意」等等。
  • 短语3中的符号,联系上下文,我们只能知道是一个人的名字,但一个人名字范围太大了,可能性太多了,基本上推理不出来。


短语3在信息学上叫做:冗余信息太少,信息熵就过大。即便联系上下文,也不能够消除不确定性。我们要么继续增加冗余信息,才能消除不确定性。



知道了这个原理,我们再来谈甲骨文的「死字」和「专有名词」,还是用举例子的办法:


  • 地名字

比如这个字,上下两「口」形,中间一个「日」形,后世也没有这个字,构形也没有办法猜测,上下问联系也一头雾水:


我们可以知道这是一个地名,因为卜辞中有很多类似「王步于XX」句式,,比如:《合集36751》:庚寅卜。。。鼎(貞):王步于杞,亡災。



  • 方国字

《合集6543》出现的这个方国名字:


我们完全可以读懂整片甲骨的意思,知道这个方国是商人征伐的对象,但就是不知道这个字读什么,造字本义是什么:

(引自:《商代史——卷10·商代的地理和方国》,页440)




  • 人名字

我们熟知的「妇好」只是殷商200多位「诸妇」中的一位,「诸妇」的名字中很多字都不认识,下面这些商代「妇」的一些名字,有些名字什么意思,读什么都不知道;

引自:《商代史——卷4·商代的国家与社会》,页136

还有,什么贞人名字、方伯名字、商人王室子弟名字,很多都是从未见过,无法释读的字。


  • 祭名字

商人尚鬼,商人天天占卜,天天祭祀,甲骨文中祭名有几百种,认识的字不过几十个。

下面的祭名,各种各样的怪字,有些是楷定字,说明字的偏旁构件今天还有,有些无法楷定,说明这个字偏旁构件今天都没有:

(引自:《商代史——卷8:商代的宗教和祭祀》,页426)


  • 还有些就是纯粹就是无论如何都读不通字,解释不了,连词性都不知道。这些字不是很多。


--------------------------------------------------------

好,综上分析所述,再来总结一下:



1、甲骨文中很多还未释读的文字,释读的最大难点在于:都是没有流传下来的死文字。大部分属于专有名词:地名、人名、祭名,这类词联系上下文无法消除不确定性。


2、我们是根据归纳卜辞的模式,推理出这个字的词性是什么,是名词还是动词,但是这个字的造字本义是什么,有没有引申、假借我们都不知道。


3、只有极少一部死字,猜测起来完全没有头绪,连词性也不知道。


4,正如徐中舒先生在《甲骨文字典·序》中所言,即便这些甲骨文中的专有名词不能释读,影响根本不大,无非就是不知道读音和构字意图。我们仍然可以读懂卜辞。



5、经济学上有个理论叫做低果先摘原理(The low-hanging fruit pirinciple)理论:果树上最低的果子一定是最容易摘的,早就被人摘了,还有些果子太高了,就是最难摘的果子。


甲骨文中「容易摘的低果」,在民国时代就被学者差不多摘完了,今天出成果比较难,正是因为「知识树的上果子,越来越高」,因此产生了甲骨文释读的「天花板效应」。


比如释读甲骨文最多的罗振玉在四十多天时间里,释读了480多个字(见《殷墟书契考释》),他一个人就释读出570多个字。


连《老残游记》作者刘鹗,如此的外行,都能释读几十个字。而今天的裘锡圭先生,估计一辈子释读也不过二、三十个字。(见《裘锡圭学术问·甲骨文卷》)



所以,并不是一些人说的「今天砖家叫兽多,民国大师多」。我还有见过有些人对我说:古埃及文读通了,我们的甲骨文还有一大半没有释读出来,今天的「砖家叫兽」真多。。。。。


我们可以对自己一无所知的事情进行评价,但绝对不要摆出一副真理在握的样子,一定要要意识到:事情有可能比我想象的要复杂,我有可能是错的。


小汉字见大历史

研什研?甲骨文不过是古越象形图案符号的进一步简化抽象,不过是当初殷纣王帝辛占卜决策国事的一种简单符号,尽管单词上百个,但没有形成词汇概念,故不能记录历史!而中国人真正记录自己历史却是在西周中后期周宣王命太史籀造出大篆后,在东周列国至春秋战国时期用大篆籀文在竹简木片帛布上开始记录书写的!


分享到:


相關文章: