汉字够用吗?为什么几乎没有再发明新的汉字了?

韩文杰V


汉字的总数量约有10万左右,而常用汉字约4000左右,那么其可以组成的词汇理论上有。

1字词:4000

2字词:4000×4000=1600万

3字词:4000∧3=640亿

4字词:4000∧4=256万亿

其庞大的词汇量足以描述真实的世界,所以暂时不需要创造单个的汉字,如果某些学术领域需要创造新的汉字也不是不可,或者也可以从以前的汉字库中寻找出适合描述新事物的汉字。

对比一下英语的造词数量。

1字词:26

2字词:26×26=676

3字词:26∧3=17576

4字词:26∧4≈45.7万

5字词:26∧5≈1188万

6字词:26∧6≈3亿

7字词:26∧7≈80亿

8字词:26∧8≈2088亿

9字词:26∧9≈5.4万亿

10字词:26∧10≈140万亿

也就是说,英语造词的话,需要把10以内的字母的所有排列组合用光还不能超过4位汉字的排列组合量,这就是为什么表达同样的信息量,汉语是所有的语言中最简短的。

更可怕的是,汉字只需要学习4000汉字,就可以完成这上百万亿的词汇量。而英语几乎要用人脑去记忆这上百万亿的词汇,天哪,这是不可能完成的任务呀。

英语的最大优势就在于它的初始学习难度极低,只需要学会26个字母,就可以完成几乎所有英语词汇的拼读,这也是为什么当今世界的200多个国家和地区中只剩下汉语一家象形文字,其他都变成了拼音文字,就在于初始学习难度低,人人都可以学习,初级的语言交流障碍几乎不存在。

而汉字的初始学习难度就相对大多了,要直接记忆4000汉字的读音、意思,而且还要记忆它们的声调,这对大脑是非常恐怖的记忆量。不过好在后来我们发明了汉语拼音,将汉字拼读的难度直接降低到了26个拉丁字母。所以汉语拼读这一块的问题解决了,然后就是直接记忆4000汉字了。其实记忆4000汉字和记忆4000英文单词的难度是差不多的,都是一个爬坡积累的过程,但是到了4000之后汉字大开大合,可以组合成无穷的词汇,而英语想要提高词汇量还得继续爬坡,两者的差距在4000字词的记忆量之后,就分道扬镳了。


飞龙在天9783




汉语是高效组合语,任何其他语言都没有这个优势。

语言的一个特性就是,你必须掌握它的基础量才能运用自如。

比如汉语体系的字,英语体系的词。随着新事物的增多,语言的基础量也在快速增加。人类有限的时间和需要掌握的基础词量形成强烈的矛盾。而汉语是被冲击最小的一种语言。原因就是汉语是一种高效组合语。

在现代社会一个说汉语的人只需要掌握2000个字,就可以读书、看报、搞科研。可在英文世界里,没有2万个词别想读报,没有3万个词别想把周刊读顺,大学毕业10年后的职业人士一般都得懂8万词。 普通使用汉语的人用2000个字就可以描绘世界,而使用英语的人至少需要8万单词。而据美国联邦教育委员会调查,美国中学毕业生七成看不懂纽约时报。而中国中学生读完四大名著完全不在话下,更别说普通的报纸了。



为什么会这样呢?原因就是汉语体系高效组合的先进性。一定数量的汉字会组合成无数的词语,不同的词语又会组合成不同的词组。神奇就神奇在你只需要了解最基本的汉字就可以懂得组合出的词的意思。而英语却不是这个样子,每形容一个事物英语都需要创造出一个新单词。这就造成了英语单词无限量的创造,切不相关。 目前的英语单词已经超过了数百万个。而所有这些单词在汉语中都可以用四千个汉字来表达。

比如pork这个词,在英语中代表猪肉,它和猪pig、肉meat没有任何关系而仅仅代表它们的一个联合体而已,如果把猪肉pork、羊肉mutton、牛肉beef、猪油lard、羊油suet和牛油talon放在一起进行比较的话就发现,英语中所有的联体词都是一个与其中任何一个分解词毫无关联的新符号,而它们却构成了英语词汇的主体,英语中几百万的单词就是这样来的。

新事物的涌现,总伴随者新词,例如英语中 ROCKET(火箭),COMPUTER(计算机),需要不停地创造。而汉语却不需要这样 ,不就是用“火”驱动的“箭”么,会“计算”的“机”么!可英文就不能这么干,由于字母文字的局限性,不能靠组词,原因是“太长”了。如 火箭将成为“ FIRE-DRIVEN-ARROW”,计算机将成为“COMPUTAIONAL-MACHINE”等 。人的视角有限,太长的字会降低文章的可读性与读者的理解能力。



有了新事物,英语又要增加一个新词,那么又要记忆。这样就形成了一个恶性循环。到最后,一个使用英语的人他的一辈子的时间,也就只够记忆这些单词,还谈什么发展!

那么人的一生中到底需要记住多少单词或符号呢?中国人所使用的汉字通常在三到四千就足够了,莎士比亚时代的英语有三万个单词,到了丘吉尔时代,英语已经拥有近百万个单词了。现代已经达到数百万。语言学家对一个受过教育的英语使用者的要求是应该掌握5万到25万个单词。未来,随着信息大爆炸,对英语使用者所需记忆单词量的要求还将进一步增加。而汉语使用者,无论未来信息如何爆炸,就算到了宇宙时代,掌握五六千汉字也完全足够了。

语言的好坏其实取决于两个方面。

第一、是不是能够用很少的记忆来掌握。

第二、是不是能够在有生之年掌握到比其他人更多的知识?用一句极限的话来讲应该是:最好的语言是不学而知,但是所掌握的知识又最多的。而汉语是最符合这样的要求的。汉语是全世界唯一一种学少而知多的语言。

汉语的高效组合现象最先是德国的莱布尼茨体会到的,他认为汉语是自亚里士多得以来,西方世界梦寐以求的组义语言。如果他看到今天知识爆炸的世界,他一定会要求世界上所有的国家废除拼音文字而采用汉字。

总结历史上中国强大,未来也必定强大,这是历史的轮回!


学好科学走向世界


所有汉字约有80000个左右,英文单词17-20万不等。

乍一看我们的汉字少这么多啊,貌似不够用。。。

但是注意:

根据《现代汉语常用字表》,我们的汉字包括常用字2500个,次常用字1000个,共3500个。就阅读一般的汉语书报刊而言,这3500个常用字完全够用了。因为实际上,我们经常使用的汉字并不多。

就算再扩展一点可能也就6000上下;事实上就这么点,里面就有很多字,有人可能一辈子也用不到了吧!

这离我们的总量80000个还差得远呐。。。另一个原因是:我们的汉字能自由组合形成新的词汇,这样算下来数量可就惊人了。只要我们不断利用已有的汉字创造新的词汇,完全没有不够用的问题啊!

所以从古至今,社会通用字的数量没有显著变化,一直在五六千左右。

英文常用的也就12000~20000个词。但是由于西方语言的特性,英文需要不断发明新词顺应时代潮流。


小安观世界


其实有一个误解,就是认为汉字认识两千个,就可以读书看报,满足日常生活需要了。实际上,两千个汉字只是基础,我们读完高中后真正掌握的汉语词语则大概一万多。小学阶段,实际上已经把常用汉字学的差不多了。而在中学阶段没有那么多生字,却有很多的生词,学生不再是用《新华字典》,而是用《现代汉语词典》。

尤其一些专业性很强的文章,或者一些辞藻华丽的文学作品,你认识每一个汉字,也能读出来,但是可能因为大量的词语不理解,而无法读懂这篇文章。这就是说,认的字数够了,但是词语量是不够的。

与英语相比,汉字理解粒度有点类似于英语词根,而不是英语单词。多个汉字组成一个新的词语,对应于英语单词。另一个例子就是日本汉语词。有不少日本汉语词,中国人是不理解什么意思的,尽管这个词都是汉字组成的,并且明白后细想这个词的汉字组成也是有意义的,并非日语读音拼出来的。

两千个汉字,理论上最多可以组成400万个双字词语,而日常个人接触的语义不超过2万。

美国研究生考试GRE也就是一万多个单词,还包括除了GRE考试一辈子也再也不会见到的罕见单词。英语因为国际性语言,融入了全世界各地的文化、概念、词语,是世界上词语最多的语言。例如我们熟悉的例如“baozi”,“Gongbao Chicken”,“Kanban”。很多英语词语并不是语义上的不同,而不是法语、德语、西班牙语、印度方言等的不同读法和写法。也有很多英语词汇是非英语国家文化单词的直接照搬,所以英语国家可能并不使用和理解这些词语,就如同中国佛教典籍中大量梵语词汇一样,比如“般若波罗蜜多”“阿罗汉”“阿修罗”。《牛津词典》收录了四十万个单词。中国《现代汉语词典》收录了六万多个词语,基本上包含了现在可见的绝大部分词语。由于中国同一个词语,尽管方言读法不同,但是写法相同,所以也要比英语少不少冗余。

所以,两千多个汉字组成的数万现代汉语词语已经足够使用了。


RaymondIT


汉字以前够用,现在真的不够用。自从进入网络信息时代以来,汉字的表述就跟不上新生事物的产生。于是就产生了一些不伦不类的的名词,形容词,代词等等。


雪豹下山


中国科学家还是创造了几个汉字的,比如,氕氘氚。2017年还造了三个新字,为新发现的化学元素命名(见图)。除第一个字鉨[nǐ],其余三个全是新造字镆、{石田}[tián],{气奥}[ào]。



云鹤阁


我们的祖先最聪明,造出的汉字可以让后人根据新生事物特征组成恰当而形象的词来。比如飞机、直升机、机关枪、手枪、手机、电视机、电子眼、电信等。

很有意思的是,当需要用汉字组成新词语时,也尽量注意并照顾到其外来发音,比如领导、坦克等。

我们古代某领导就根据日本岛民的诸项特征,特地起了个“倭”名,这是巧妙地以部首组合成的字。

应自豪高呼:汉字万岁!万万岁!


鲁秦中51321308


现在全世界中外语言学家都意识到了,汉语会成为未来唯一高效的文字,特别是到了互联网信息时代。给你讲通俗点的例子,中国几万个汉字你只需要学会其中几千个就能正常阅读和交流,英语要学几十万个单词。如果有新兴事物,比如雷达,汉语只需要将雷、达二字组合就行,汉字数量本身是不变的,而英语则需要重新发明一个单词“radar”,新事物和词语会越来越多,英语会增加到千万级以上的单词量,最后语言崩溃。而汉语还是不变,还是只要会几千个汉字就能交流!汉字比英语,就等于三维对二维!


没事偷着乐


一、汉字,”传说”是黄帝时代的史官仓颉所创造的。他观察万物,依据物体的形状造字。不过虽说古书上有记载,但这毕竟只是”传说”而已。其实汉字是起源於先民”结绳记事”是我们祖先共同努力的创作,仓颉可能只是”整理文字”的人。 文字是因为使用上的需要而逐渐由少变多的, 是约定俗成的。 大家都知道秦始皇统一文字,所以在秦以前,文字的写法也因为国家的不同而有不同。汉朝时候隶定,把图画式的小篆,改成一笔一画的隶书,更方便传抄使用,文字的形状大约就定型了,当然还是有所改变与增加而繁体中文,就是『仓颉』所发明的喔! 这也就是我们中国文字的起源!

二、为什么要造生僻字?

生僻字和常用字是相对概念,常用字用的人少了就会变成生僻字。生僻字用的人多了就会变成常用字。当一个字产生之初,是很难预计它未来的使用频率的,也谈不上创造生僻字。

三、为什么《说文解字》收字不到一万,随后历代字书韵书搜罗到的字越来越多,《汉语大字典》收字五万?

这反映了人们日益增长的精神文化需求和落后的表达力的矛盾。这不很正常嘛!

四、字典中很多字读音意义都丢失了,说明只有造字者自己用过吗?

汉字是形音义三位一体的,但有时候确实会出现「丢失」的情况。比如很多方言字,有音有义但是不知道写法,丢失了形。在出土的古代文献中,也经常出现一些现代失传的字。你不知道它的读音,但是可以通过上下文推断它的意思,那么就可以说它保留了形、义,丢失了音。但万一上下文也推不出来意思,音义都丢失了。整理者一般会把它们列出来「待考」。考不出来的,一般也会留下来,甚至编在字典、字编里。现代是这样,古代也是。所以你在《康熙字典》或者其他古代字书看到音义不明的字,并不是字典的作者故意编出来糊弄你的。而是他们把搜罗到无法解释的字也列在字典里,留给後人解决。(当然也不排除有某些道德品质败坏或者水平极差的字典编纂者,为了争个「收字量第一」的虚名,有意无意地创造垃圾字的可能性的存在。)大浪淘沙,在波涛汹涌的历史长河之中,会有很多汉字逐渐被人遗忘,或者变得面目全非。在楚文字中有一个上羽下能的字,我特别喜欢拿他举例子。因为早些时候发现,大家都不认识,各种猜测。後来大量楚简的发现,我们知道这个字是用为「一」,但它读作「一」吗?当然,有可能,却也不能说死。如果没有後来这种楚简的发现,我们可能永远都不知道这个字啥意思。出题人也会觉得这个字可能只有发明人认识,後来发现原来这个字在楚文字中这么常见啊!时移世易,即使常用字也有散佚失传的可能性。(当然在信息交流和保存如此方便的今天,除非发生无法想象的史诗级灾难,常用字基本不会失传了。)

五、为什么即使够用,还是会有古人造新的异体字?前面啰啰嗦嗦了很多,但我想并不是出题人关心的内容。出题人应该是想问这个问题。对呀,现存的字能够满足生活习惯的前提下,为什么还要造新的异体字出现?其实可以分为两点:

1、无意识造字。或者说,提笔忘字写错了。以讹传讹就成了新字。这些新字被称作俗字,而和他等价的旧字被称作正字。当新字越来越流行,以至于通用。它就从俗字摇身一变成了通字。这就是古代字书上常见的「正」、「俗」、「通」之辨。

2、有意识造字。

1)为了书写方便。用简单的笔画代替原本复杂的笔画而产生新的俗字。

2)为了满足强迫症(偏旁类化)。细致一词古代可以写成「細致」,也可以写成「細緻」。後者中的「致」为了和「細」呼应,就演化出来个「糹」。经常阅读影印古籍的朋友对此应该并不陌生,古籍中经常看到为了追求偏旁部首的统一美观而修改偏旁的情况。这就出现了新字。

3)追加或该换声符、形符。把汉字细分,使其更系统。(和上一项有交叉)

比如「舍」可以表示{舍弃}和{房舍}。後人为了把两个义项区分, 把表示{舍弃}的舍加了个「扌」。产生了新字「捨」。这时候我们一般用「古今字」的概念表述两者的关系。这是比较合理的情况。

有的时候的细分可能会让人崩溃。《说文解字》里有这么一个字「盌」,解释是「小盂也。从皿、夗声。」就是我们吃饭用的碗。但有人说了,我家的「盌」是木头做的,于是就有了「椀」。同理还有石头做的「碗」;陶瓷做的「㼝」;金属做的「鋺」。类似的还有锅、盆、瓶、盘等,几乎任何器物只要能用不同材质制成,都有好多种写法。只不过现代的规范汉字只选了其中的一个罢了。

4)理据重构。当久远的造字理念逐渐被人轻视或遗忘。古人可能就会造一个新字,和原来的字可能在形体上没有关系。比如《颜氏家训》中提到北朝「更生爲蘇」,造了一个「甦」字。

4)非汉字原因。比如为了政治目的(武则天造字)、宗教目的(老君碑上的字)、翻译目的(为了翻译佛经咒语等造的新字)、宗族文化(家谱排辈人名造字)等。

另外还是想多说几句。古人其实都希望能有个正字标准的,但无奈生产力低下,管制力度也有限。你能管得了考生不乱写字但你管得了芸芸众生吗?你能管得了几个避讳字,管得了所有字吗?所以说真正的规范还是在信息时代完成的。计算机编码这个东西真是可怕,只要它不收的字你就打不出来。在这个人人打字的年代,想要求异是很难的。在知乎上我认识几个专门用异体字写答案的人。他们虽然想要用特别怪异的字,但也没有变法突破字库的限制,否则出来一堆豆腐块,别人都看不见也没有意义。

古代汉字的使用,十分复杂和混乱。通读了一遍我写的东西,感觉也是东一榔头西一棒子,不够晓畅。但是我也想让大家理解,几千年来人类文字的使用都是具有这样的复杂性和多样性,特别是数量庞大的汉字,并不是谁「非要」怎样就能怎样的事。


那年的路人甲


谁说没有再发明过汉字?

只是最后觉得不对才又改用古人发明的汉字了。

比如过去两块,两毛,两分钱上的“貮”字。

比如现在书上“何日复江南”的复字

“复”字在这里读de的话不对,不读de也不对。原话是:何日得江南。


分享到:


相關文章: