论简体字之不科学,不可行

论简体字之不科学,不可行

首先我们要考虑一下文字的特点。1,文字是来描述客观世界的,所以要描述的客观世界有多精细,对应的文字就要有多精细,比如,鱼:鲫;或者文字串就要有多复杂,比如,粒子:在前一秒钟从这个粒子加速器发射出的高速粒子。2,我们对客观世界的认识在不断深入,所以我们的文字系统正在变的越来越复杂。不外两条路:一则造些新字,比如以前“然”就有燃烧的意思,但是“然”后来也有别的意思,所以古人为了很好的区分,就又造了个“燃”;二则造些新的字的组合,比如“粒子加速器”。3,文字要符合熵编码,对于常常说到的东西,也就是没有什么信息含量的东西,我们用简略的符号来表达,比如“空调”;对于不常用到,所以信息量很高的东西,我们要用复杂的符号或者符号串来表达,比如“新型节能中央空调”。这就是说,每个新创造的字或者字的组合,都是当前出现概率最低的字或者字的组合,所以是最具信息量的字或者字的组合,因此就是最复杂的字或者字的组合。等你造下一个呢?当然要比现在的还要复杂。另一个角度的道理也很简单,简单的都被用掉了。4,就文字本身而言,必须要有内在的逻辑。也就是字与字之间的特点,要符合事物与事物之间的特点。比如“兄”,意思就是个动口不动手的人,当然就是你的大哥啦。你不可能象电脑一样,把一个东西命名成0,第二个东西命名成10,第三个110,这样随意的指派符号,简单固然简单,但是人是记不住的。总而言之,在同一书体内,文字之可能变得复杂。

现在我们来看看我国文字的发展,经历了好多书体的变化:甲骨文,金文,篆书,隶书,楷书。每一次变化,都使得书写变的简洁,为造新字开拓了空间;并且每一次书体变化,都继承了原来的文字符号。也就是说每一个新的书体,所能包含的符号,都要大于旧书体所能包含的符号,也是说,在同样书写强度下,新书体书写出的符号复杂成都超过老书体。这是一种激动人心的革新。这里面还有另外两个旁枝:1,来源于隶书的草书。2,来源于楷书的行书。这两种是对旧的书体的简化,它利用字的信息的冗余,只书写字的最核心的结构信息,使得书写速度加快。但是这就导致了阅读者的困难,因为如果你没有受过训练的话,你虽然能确认这个书写符号不会和类似符号混淆,但是你还是猜不出他所对应的本源符号是哪一个。原因在于信息丢失过多,已经违背了熵编码,导致这个过程不可逆。解决办法是,你必须有额外的文字知识,通晓这两套符号的对应关系。也就是说,对书写的节省,其实就是对阅读的惩罚。极端的情况是,只有文字知识非常丰富的书法家们才能相互书写和欣赏狂草。

现在我们来看看简体字。很显然,简体字不是书体的变化,因为简体字的书写方式还是属于楷书,它能包含的符号个数和繁体字一样多。简体字的追求只是希望书写符号变的简单,这是一种类似于草书和行书的追求。以草书和行书被限制使用的命运来看,这种追求显然下场不妙。其实很简单,就象我在一开始说的,在同一书体情况下,文字始终符合熵编码,总是先把尽可能简单好用的字给用上,留下复杂难写的组合给未来人用,始终在变得越来越复杂,而不是反过来。所以要想简化,必须创造新的书体,来一次真正的革新,草书行书之类的投机取巧肯定我在文章一开始提出的4个原则,所以肯定失败。简体字的拥护者总以为简体字是革新,其实完全是复古,而且还是重复古代的失败。

让我们看看简体字实际上是怎么做的。简体字简化的原理之一就是把草书楷书化。比如,“说”,老师总是会告诉你左边是个言字边。在草书里这是成立的,在楷书里,左看右看也不象。没办法啦,只好死记硬背吧,加重了阅读者的负担。因为利用了草书的原理,所以也得到了草书的惩罚。第二个原理就是寻找更加古老简单的字来代替现在复杂的字。这更是开历史倒车了。实际上古人把字弄的复杂,完全是因为古人对该字对应的事物有了新的理解,所以把原来的字给废弃了。比如“礼”。古人写做“禮”,那个右边下面的“豆”,指的是容器,上面的“曲”指的是贡品。所以实际上礼的意思就是礼仪,礼节,祭祀等等。看到“礼”字,你能猜到这个意思吗?没办法,还是死记硬背吧。顺便说一下,“體”并没有简化成人+竖弯勾。这样一来,即使你记住了“礼”,你还是要用额外的工夫记住“体”。实际上,在古代,“体”和“體”是两个不同的意思,“体”的意思是粗壮,笨重;而“體”是和“禮”有关联的,指的是献祭的牲畜的骨头和肉体,也就指身体。这种随意的合并,便是简化的第三个原则。他严重的影响了汉语的精确和优美。再比如,把“髮”与“發”简化成“发”,那么“发如韭”是什么意思?是头发象韭菜一样生长旺盛,还是某种植物象韭菜一样开花?实际上,一字多意,对古人而言,实在是不得已为之,如同现在的错别字,为此古人不断的制造更加复杂的字,使得汉语精确优美。现在有了简体字,从字面获得的信息大为减少,所以我们再也不能只写“发如韭”,因为我们必须制造更加复杂冗长的句子,提供更多的上下文,才能补足这些失去的信息,所以我们的句子不可避免的欧化,看看都不象中国人了。字的简单带来了句子的冗长,阅读者固然受到惩罚,书写者的好处又在哪里?简化字还有好几种别的简化原理,全都是有各种各样弊病的。有的甚至用一些贩夫走卒制造的错别字,或者书法家一时兴起制造的错别字。贩夫走卒和书法家的错别字完全适应他们自己的简单环境,但是用于现实环境,即使自己不出问题,也会导致别的字显得不合理。就好像爱因斯坦说的,你需要把现实问题尽可能的抽象,但是不能抽象到比现实问题还要简单。

总而言之,从古到今演变而成的文字代表了我们从古到今知识的积累,人为地扭曲文字,显然也就破坏了我们知识积累形成的体系结构,怎么可能不受到惩罚?简体字的特点是奖赏书写者,惩罚阅读者。这完全是给电脑这种有众多孤立记忆点,而不能融会贯通,进而形成体系结构的机器用的。而且书写和阅读是极不对称的。一次书写对应着好多次阅读,古代已经是这样,今天已经更加突出。要实现一次书写,其实在之前已经实现了无数次阅读。所以就是书写者本人也已经先交了罚金,又何简之有?所以在我看来,简体字在理论上是错误的,在实践上是破产的,简体字的创造者的懒惰愚蠢和狂妄自大是绝无仅有的。

楼主 巴比伦的清教徒  发布于 2004-07-31 17:00:00 +0800 CST  

楼主 巴比伦的清教徒  发布于 2004-08-01 07:59:42 +0800 CST  
我觉得写着简体字来反对简体字是一件非常摩登的事情。五四的时候,大学问家们不也是写着文言文来反对文言文吗?
楼主 巴比伦的清教徒  发布于 2004-08-01 08:43:22 +0800 CST  
谁告诉你文字就是象形啦?这些构造字的模块已经高度抽象了。你看到“豆”就能自动想到容器吗?看到“曲”能自动想到祭祀用的物品吗?但是我这样告诉你了,你把它们记住,以后教你认字就容易很多。记住几十个造字的模块,然后再记住模块的摆放容易?还是直接记住几千甚至几万个汉字的一笔一划容易?语言是来方便交流的,你花那么多时间来记忆毫无规律的简体字,何苦来哉?

就好像英语,~able表示被动的能力,~tive表示主动的能力。我们虽然并不知道~able,~tive的由来,但是一旦记住这两个字根,就有一大片的单词不用记忆了。就好像spect表示看,in表示内,per表示透过,那么inspect表示检查,perspective表示透视。要是统统死记硬背,过46级要到哪一天啊。

英语和繁体字,虽然截然不同,但是造字方法,却有相通之处,就是力求通过字的结构来表示所代表的事物,以便方便记忆。但是简体字不是这样的,只适合电脑使用。
楼主 巴比伦的清教徒  发布于 2004-08-01 09:22:47 +0800 CST  
那你觉得“口”这个组合复杂,还是“空调”这个组合复杂?你觉得“空调”这个组合复杂,还是“新型节能中央空调”这个组合复杂?你是不是觉得越复杂的组合,出现的概率越低?

顺便说一下,“空调”以前叫“空气调节器”,因为那个时候空调太稀奇了,完全是个有爆炸性信息量的东西,所以我们给他一个复杂的文字串。但是后来这玩艺很平常,大家就给他一个简单的字符串“空调”,以适应他现在给我们带来的少量信息。就好像一开始美国是很希罕的,叫做United States of America,后来太平常了,就叫usa了。这就是利用我们知识的冗余做的简化。
楼主 巴比伦的清教徒  发布于 2004-08-01 09:32:29 +0800 CST  
实际上这种简化是有代价的。因为从另一个角度,这就是个下定义的过程。usa=United States of America,AIDS=Acquired Immure Deficiency Syndrome。如果交流双方有一方不知道这个额外的定义,那么交流不可进行。所以写论文的时候,一般都要附有缩略语表,这样大家才能审查你的文章。
楼主 巴比伦的清教徒  发布于 2004-08-01 09:37:43 +0800 CST  
作者:巴比伦的清教徒 回复日期:2004-8-1 8:43:22
我觉得写着简体字来反对简体字是一件非常摩登的事情。五四的时候,大学问家们不也是写着文言文来反对文言文吗?

楼主 巴比伦的清教徒  发布于 2004-08-01 09:41:48 +0800 CST  
因为常用,所有就失去了信息量,所以就要简化它。这才是正确的简化方式。但可惜的是,即便这样,这个简化称谓还是必须要力求揭示所代表的事物。请看,“调”是里面最复杂的字,但是就是不能因此去掉,而把它说成“空节”,“空器”,“气节”或者什么别的。也就是说,对于一个字,如果变得常用了,可以考虑简化,但是底线是不能使得它丧失揭示它所代表事物的足够信息,除非是双方都知道他只是个缩略定义,比如usa。

那个矮字我自己可以解释,但不能肯定符合老祖宗的意思;伟字很容易,左边是个人,右边上下面是背靠背的意思,中间是个口。意思就是这个人和某个别的什么形成强烈对比。好象老牛旁边一根嫩草,这就是伟大啦。

“quick”加字根ly成“quickly”,这是个非常精巧实用的造字方法,与整个英文的实用是完全吻合的。但是我们要做到这一点,就要加好多字,就很笨拙。为什么,因为不符合汉语习惯。知道日本人美容院怎么说吗?是“美人ing”,我在张承志小说里看到的。这才是真正的简化。

秦朝以后,我们造了非常非常多的字。比如,“然”,接着造了个“燃”;“番”接着又造了个“蕃”;“虜”接着又造了个“擄”。都是因为一词多意,不堪使用。实际上这种加草字头,加火字旁的办法才是可以和ly相媲美的。而且简化字里有一条原则:用先前古代的简单的古字来代替晚期古代的繁琐的古字。这就完全说明了字越造越多,越造越繁。

我的看法,要么采用科学成熟的繁体字,要么用英文,要么学日本。
楼主 巴比伦的清教徒  发布于 2004-08-01 10:19:59 +0800 CST  
o?你看到“發”,能猜到这是发吗?你看到“禮”,能猜到“礼”吗?
楼主 巴比伦的清教徒  发布于 2004-08-01 10:26:26 +0800 CST  
老大,现代社会的信息量就有这么巨大,而且越来越大。你把字简化了,代价就是要字写的多,提供足够的上下文,否则沟通就失败。这是何苦来哉?
楼主 巴比伦的清教徒  发布于 2004-08-01 10:29:25 +0800 CST  
其实英语国家的人,口语非常简练,还有数不清的俚语。但是书面用于是非常严谨的,尤其是科技论文。就好像我们古代写文章用文言文,讲话用白话文。这是全世界人民千百年来摸索出的正确方法。

贩夫走卒和书法家处于两个极端,他们都喜欢造一些错别字,因为这很适应他们自己的环境。我当然认为这是可以的,但是以他们的字为标准,就太过分了。
楼主 巴比伦的清教徒  发布于 2004-08-01 10:35:15 +0800 CST  
gmmdomc说的有道理。
楼主 巴比伦的清教徒  发布于 2004-08-01 10:37:06 +0800 CST  
我之所以知道什么是真正的简化,是因为我学过信号理论,学过熵编码,学过压缩理论,包括无损压缩。所以我有足够的知识来做判断。

说到简化字丢失信息,以及为了弥补这种信息的丢失,我们必须提供更多的上下文,我在主贴都谈过了,就不谈了。

关于字的构造模块和字的使用的关系是这样的。老师教你的时候,告诉你构造模块和构造结构和字的意思之间的联系,你会记忆的更快,而且更不容易忘记。等你熟练了,你就可以脱离这种间接的联系,直接把字形状和字的意思联系在一起。而简体字呢?你只能直接把字的形状和字的意思联系在一起,中间没有一点道理可讲。这样记忆的负担就加重了,尤其是那些擅长逻辑思维而不擅长死记硬背的人,就苦不堪言了。也就是说,繁体字有可能帮你猜出你不认识的字,但是更加可以减轻你的记忆负担。

我说我不能肯定我对矮字的解释是不是符合老祖宗的意思,隐含的意思就是,我说的其他字都是符合老祖宗意思的,因为全是从专业网站看到的解释。呵呵。

“痛苦ing”是个简化,因为我们知道痛苦是什么意思,也知道ing是什么意思。所以我们完全知道“痛苦ing”是什么意思。但是“RPWT”不是,因为从这个缩写,我们猜不出它的原意是“人品问题”。实际上我认为中西文合用是非常好的办法,我并不对保持汉语的纯洁性有什么兴趣。我只是觉得简体字得不偿失。如果发现火星字更科学更实用,我就建议改用火星字。

东汉许慎的《说文解字》收字9353,康熙字典收字47000,你说秦朝以后我们的祖先有没有大规模的造字呢?而且我根本不用回答你这个问题,因为就算我们今后要以制造新的文字串,也就是词为主,但也得不出我们需要简化繁体字这个结论。

关于“射”,那个“寸”来源于“矢”。但是个别繁体字的字的不可解释,并不影响繁体字整体上的合乎逻辑。实际上,简体字并没有改变“射”和“矮”。
楼主 巴比伦的清教徒  发布于 2004-08-01 12:14:57 +0800 CST  
问题是简体字不可能书写快捷,因为要表示的信息就有那么多,你必须有足够的符号加以描述。比如你不可能只写一个“发”,你必须写“头发”,或者“发展”。也就是必须要提供足够的上下文。
楼主 巴比伦的清教徒  发布于 2004-08-01 12:46:56 +0800 CST  
这个我在主贴里写过啦。这些懒惰的简化字创造者直接找了个更早更简单的字来代替复杂的字,也不好好想想古人为什么要废弃那个不好用的简单字。

而且从这点上可以看出,文字当然是越来越复杂,直到不堪重负,那么彻底更换书体。
楼主 巴比伦的清教徒  发布于 2004-08-01 13:11:26 +0800 CST  
简化就是一种压缩嘛,不从熵编码,无损压缩的角度考虑,你还能从什么角度考虑?难道还从有损压缩的角度,或者从绘画的角度考虑?

甲骨文,有很多部分是在画画,到是可以做有损压缩的,比如缺个一两笔也无所谓。但是到了隶书及以后,文字完全规范了,就绝不可能这样做了,少个点都会出问题。

在一个书体内,文字只可能越来越繁,否则必定和以前的有冲突。要想压缩,要么是用简单的文字串,要么创造新的书体。而且使用简化的字串其实并不节省人们的记忆。比如美国人用usa,实际上他们还是要先记住United States of America才行。台湾有人把“臺灣”简写成“台湾”,但是那里的人还是会指出这两个的本源是“臺灣”,不会把这两个字废掉,而直接用“台湾”。说到底,这只是利用知识上的冗余,做了个重新定义。换到简体字,你愿意一面写着简体字,一面记住一张有2000多项的繁简字对照表吗?实际上,如果简体字只是简化极少量的生僻字,对原有的汉字体系不造成冲击,其实也无所谓的。现在这样一高,我们已经很难明白为什么一个字要这样造,要那样造,好像老祖宗是用一个随即序列来造字的。

再说一遍,繁体字或许能让我们真的望文生义,但是繁体字真正的优点在于减少我们记忆的负担。它不能让我们无师自通,但是可以让我们只被稍微教几遍,就牢牢记住。就好像通过词根来记忆英语单词。

至于繁体字比简体字结构的合理,可以更好的揭示它所代表的事物,是我一直在论证的,你不承认的话,我也没办法。
楼主 巴比伦的清教徒  发布于 2004-08-01 14:57:37 +0800 CST  
我说的压缩,是指人们认为汉字的表示是有冗余的,为了表达同样的信息,可以考虑少写几个字,或者每个字少写几个笔划。而接受者也可以接受这种新的表示方法,所以无需还原。很可惜,我认为这是不可能的。狂妄自大的人把祖先想的太笨了。真的要压缩,只能创造新的书体,就好像祖先那样干。

实际上如果不考虑对方直接观看,我们可以用winzip软件压缩这个贴子,字节数可能要比现在少一半,而且还原出来一点不差。怎么样?比简化字效率要高很多吧。

沿着这个思路,在极端情况下,我们用布莱叶盲文,墨尔斯电报码来代替简体字,将会非常高效,因为他们比自然文字更符合熵编码。可惜的是接受方多半记不住,要查码表。如果一个社会真的这么做的话,恐怕就要崩溃了;在缓和情况下,我们用一种更加简化而更加需要机械记忆的字来代替简体字,我看这个社会还是会正常发展。代价就是,人们要花更多的时间来掌握本国的语言,完全违背创造简化字的初衷。想想看,简体字本来是要优于繁体字的,现在沦落到比起台湾香港,新加坡也并不落后的地步。那我们当初何必创造简体字?

我不知道有多少人知道AIDS=Acquired Immure Deficiency Syndrome,但是一个人真的要了解AIDS是什么,必须知道AIDS的症状,得病机理,理疗方法,在全世界的发展形势,如何预防,如何宣传,目前已有的研究成果。。。等他知道了这些,自然就知道了AIDS=Acquired Immure Deficiency Syndrome。你当然可以说,肯定有一大批美国人只要知道AIDS是一种可怕的传染性疾病就可以了。那么我认为对他来说,Acquired Immure Deficiency Syndrome提供的信息就过多了,是一种浪费。就好像一个环境简单的农民只需要一些简单的字。同时,他还受到一种惩罚:他肯定很困惑,为什么这个病要叫做AIDS,而不是AID,AI,或者A?反正这些缩写对他而言都一样。而等这些他不明所以的缩写越来越多的时候,他会受到第二个惩罚:他不理解这些缩写后面的确切含义,他也不明白缩写和所代表事物的对应关系,所以他不可避免的就会混淆。这是命中注定的。其实一个人一辈子偶尔死记硬背几个缩写是无所谓的,但是想想看汉字里有2000多个缩写啊,要耗费我们多少记忆啊,多么恐怖啊。

所以正确的做法就是绝不能只用缩写,却抛开他所代表的本源的文字。对于一个与这个缩写较少发生关系的人,可以只知道缩写,因为他不需要额外的信息。比如买空调的顾客;对于一个空调专业的人,就一定要知道全部。对于简体字来说,它简化的都是日常用字,也就是说,都是每个人都应该深刻了解,完全掌握的字。这是一种对智力的绝大浪费。

繁体字的字根,每个人都能说出几个,你可以随便找个人问问。
楼主 巴比伦的清教徒  发布于 2004-08-01 16:31:49 +0800 CST  
二两锅贴,你想用你的回贴来试探我的智力吗?为什么因为汉语看起来是最省的,所以他还可以进一步的节省?况且汉语的节省是说用的字少,并不是说每个字的笔划少吧。说到字数少,看来还是要恢复成文言文啊,这才可以进一步减少字数,利于书写。呵呵。
楼主 巴比伦的清教徒  发布于 2004-08-01 16:40:39 +0800 CST  
to 二两锅贴
我从没有说繁体字简体字谁更好看,我是说,谁更科学,谁更可行。或者说,谁用起来代价更小。

而且,你很难说我们中文要比英、法、俄等文字短小,只是看起来这样而已。比如和英语对比,在一篇同样的文章里,我们的字数远远小于他们的字母数。但是,我们每写一个字,都有47000种选择,而他们只有26种选择。所以这种比较是不公平的。公平的比较是,用unicode字符集来存放这些文章,然后用压缩软件压缩,再比较一下2者的长度。

既然这个事情很难说,也就很难说我们有简化笔划,增加长度的必要了。而且少写几个笔划,却要多写几个字,最好的结局不过是从朝三暮四到朝四暮三吧,真是“吾未见其明也”。

另外,汉语缺乏简单明了的时态、单复数规则,但是并不会造成语句歧义。因为它提供了别的办法把事情说清楚。说到英语,这才是个模糊不堪的语言,所以才好学,才有很多人会。不过这并不影响我对它的喜爱。加利曾说,英语是最容易说的糟糕的语言。其实重要的文献,一般都要出德语版本做为对照,英语什么也不是。

to nicotineone
1,你可以把简体字看成是繁体字的缩写。比如“體”“体”都写成“体”。“髮”“發”都写成“发”。所以这种映射是不可逆的。
2,把“禮”映射成“礼”,但是却把“體”映射成“体”。所以这种映射关系也是不明了的。
3,映射的时候,丢失了字的最核心的信息,使得简体字完全成了必须死记硬背的符号。就好像把适合程序员看的源程序,映射成适合机器看的二进制代码。
所以,这种映射既不等价,还很愚蠢。

to TakeIt
欢迎你给我们讲解信号压缩理论。

to supsonic
“射”里面那个“寸”其实就是“矢”。你不要跟着以讹传讹了。

to 斑竹
请把我贴子里所有建议我用甲骨文或者结绳纪事的跟贴删掉。有不同意见可以探讨,但是有傻逼就不好了。
楼主 巴比伦的清教徒  发布于 2004-08-03 22:02:35 +0800 CST  
to qsyyls
说到“茴”字的几种写法。我认为这是汉语的优点。因为它提供了一种竞争的机制,最后剩下的肯定最符合造字原理,最符合是用习惯,赢得了最大多数使用者的那个字。这才是我们的文化开放,有活力的表现。
楼主 巴比伦的清教徒  发布于 2004-08-03 22:09:18 +0800 CST  

楼主:巴比伦的清教徒

字数:12467

发表时间:2004-08-01 01:00:00 +0800 CST

更新时间:2016-11-27 22:43:12 +0800 CST

评论数:198条评论

帖子来源:天涯  访问原帖

 

热门帖子

随机列表

大家在看