最近看了一个电视讲演是讲汉字的优点的,演讲者用联合国的五种工作语言的文本作为例子,任何一个文件的中文文本比其它语言的文本摸起来都比较薄,为什么?因为中文句子比较其它语言的句子要短,这确实是一个很大的优点。
人类由于交流和记录的需要创造了文字,文字的发展在最初都是像形文字,比如很多早期洞穴里发现的岩画,是为了记录或者是叙述某一个事件,这些逐步抽象成为表意文字,但世界上绝大多数的语言都 舍弃了象形的表意文字走向了表音文字,早期的玛雅和埃及的像形表意文字都被放弃了,亚洲的日朝越语言也从最初接受的汉字发展出各自的拼音文字。唯有中国的汉字保留了下来。
汉字是有很多优点,但和拼音文字英文比较也有很多缺点。回想自己学中文长大的经历,大学毕业来美国念书的经历,和孙辈在美国出生成长的经历,对于学汉字和学英文的比较,体会和观察,觉得汉字作为象形表意文字和英文作为表音文字比较有三个重大的缺点。
首先是学中文难,尤其是学中文的读和写非常难。英语国家的小孩,从出生开始呀呀学语,到五岁时开始学26个字母和拼音规则,不到一年的时间,很快就会写,会读,会用这五年听到和学会的英文了。他们从两三岁起听的和看的恐龙,动物和其它儿童广播电视节目,学会拼音后,这类的书都会读了,我的两个外孙正在上小学,老大二年级第二学期,能看几百页的书。老二一年级第二学期,在课后读几十页的书,几天一本。我不了解现在中国小孩学语文的情况,我只知道我自己当年在同样岁数时读不了这样的书。
这是学中文难造成的,中文的字和读音是两回事, 小孩听别人讲话,学会了说话, 只是知道了这个字的读音,要想读和写,得学一个和读音完全没有联系的汉字,还要把这个汉字和读音联系起来,中文要学到上千字才能达到起码的阅读水平。我感觉在中国小孩可能要多用一到两年时间,也就是学到小学三四年级,阅读中文的水平才能达到美国小学一二年级学生阅读英文的水平,我们都知道知识是靠大量阅读才能积累的,阅读才是最重要的学知识的途径。
中文难有两个重要的后果,一是造成了扫盲比较困难。一是达到同样的阅读水平,学中文的小孩要比学拼音文字的小孩迟一段时间。这两个后果放到一个人身上可能并不是什么了不起的事。但是想想放到一个有几亿人口和有几千年文化的民族,它的积累效果是不能忽视的。前一段时间网上大家讨论为什么十五世纪之后中国的科学没有得到发展。我不敢说中文难是唯一的原因,但我敢说中文难一定是原因之一。
第二个大的缺点是中文的同音字太多。文字的产生和发展是因为人类传递信息的需要。最基本的途径是说和听。最重要的器官是嘴和耳朵。其他的感官加上手舞足蹈,也可以用来传递信息,但毕竟只是个辅助工具。研究表明,人类语音和听力几十万年的发展,大部分人能够清楚的传递并分辨的音素不到200个,世界所有部族语言中,表达使用最少的一种语言仅用11个音素,最多的一种部落语言用144个音素。大部分语言使用的音素在40~70之间。
按百度上的说法,音节是听觉能感受到的最自然的语音单位,由一个或几个音素按一定规律组合而成,汉语生字中,一个汉字读音就是一个音节,每个音节由声母韵母和声调三个部分组成,有的可以没有声母或声调,但一定有韵母。中文国家规定的标准拼音,国标汉语拼音有23个声母,韵母有24个。再加上16个所谓的整体认读音节,比如, 知, 吃, 时, 等等16个。共有63个独立音素。中文的韵母上又有声调的变化,一般来说是分为四声,也有说还有第5个是轻声,这样来标明声调,阴平,阳平,上声,去声和轻声。
由于中文字最长用三个音素来拼成“单音节”字。根据拼音规则组合的结果,如果不考虑声调,仅仅有414个独立的“单音节 ”,就算全部都有四声,总共也只有一千六百多个独立的音节,只能涵盖一千六百多字。一共只有这么多的位子,任何在最初一千六百多汉字后创造的汉字都不得不使用重复的音节,中文常用字近五千,康熙字典收录五万字,这就是为什么中文有如此多的同音字的原因。
同音字的麻烦不言而喻,网上已经有无穷无尽的笑话例子。听的人实际上是在不断的猜或者是"联想”说的人用的是哪个字。猜不到的话,就只好问说的人用的是哪个字儿。而很多时候是听的人猜错了,造成误解。还有时候听的人实在猜不到,而说的人也没办法解释清楚的话,只好写出来让对方看。这种情况在说的人用了生僻字或者是说姓名的时候常常发生。
汉字的单音节使的独立音节的容量只有一千六百多个。这使得汉字的同音字特别多。也显示了汉字的第3个大的缺点。那就是有限的容量限制了汉字发明创造新字。人类新知识的不断扩容。我们又是在信息大爆炸的时代。新的词不断的创造出来。拼音文字只要增加一两个音素就可以容纳成千上万个新词。而汉字呢?是可以很容易的造出一个怪癖的字,但一定是一个同音字。要扫这一个字的"盲”不是不可能,是相当的困难。
人类的口耳作为传递信息的主要器官。几乎只能发出和接受一维信息,或者说是声音的一维时间序列信号,一个随时间变化的声音频率信号。眼睛可以观察到二维信息。但人没有一个器官可以发出二维信息。眉目传情或者手舞足蹈是人在这方面的努力但可传达的信息非常有限。要选择一种符号作为这个声音时间序列的表达。最直接和最经济的应该是表音符号,也就是表音文字。因为有人类发音器官的限制,作为信息交流的表达,表音符号或者说是表音文字是自然的选择。表意文字如中文也受这个限制,所以必须除了能代表特定的像形意之外,还暗含一个能标定这个汉字的声音符号--拼音,因为人类信息的传递,必须有一个唯一标定该信息的声音。
综合以上所说,似乎各种语言最终走向拼音化是一个自然的选择。事实上中文在历史上也在拼音化方向上做过不少努力。但因为中文的短拼"单音节”形成的大量同音字以及各种各样的地方口音如四川话,广东话,使得拼音化的推广困难重重。
现在大大小小的计算机,各种各样的电脑,智慧手机越来越普及了。中文输入最流行的方法是国标的拼音输入,语音输入也要求用普通话。总趋势间接的推动了中文向拼音化方向的发展。当然只是走了很小的一步。 电脑的拼音输入法使你不需要会写某个字,只要会读就行了,当然这种拼音是国标的普通话拼音。这对于普通话的推广是一个极大的帮助,这种趋势继续下去,各种地方方言会逐渐式微甚至于消亡的。
中文要想完全彻底的走向拼音文字,大量的同音字是一个很大的障碍。如果把两个中文字连成一个词组,可能还会有同音词组。但是可能性将会随着组词字数的加多而迅速减少。我相信在这个方向走下去,大量的拼音唯一的中文词组会被筛选出来。这个过程,中文拼音的414个独立音素并没有增加,但词变成多音节,一个词使用的音素也从现在的两个增加到七八个甚至更多,音节长度的增加使新词的包容量以阶乘增加。这个过程可能很长,但总有一天全部的现在用的汉字会被拼音唯一的词取代,汉字的全面拼音化最终实现。到那个时候我们现在用的汉字就被作为一种艺术长久的传承下去。