【科学分析】汉语是世界上最先进的语言(转载)

英文的单音节词非常丰富,实际上比中文的单音节发音要多。这是因为英文可以在一个辅音-元音组合的前后都添加辅音,来实现各种不同的单音节发音,这样排列组合下来,英文的单音节词就是一个比较庞大的词库了,但是这就有一个代价,就是抗噪性能低,这个问题我们放在下一节讲解。

按西方音节定义,英语的单音节词的使用比汉语要频繁,根据统计分析,汉语使用者平均词长约为1.5字上下(见《ReadingChineseScript: A Cognitive Analysis》这本书里有一个章节《Eye Movements in Reading Chinese andEnglish Text》)

而成年英语使用者平均每词音节数约为1.4(见http://www.waisman.wisc.edu/phonology/pubs/PUB30.pdf这也得到了另一个研究的支持:分析10小时的发听录音,平均没词音节长度为1.38)。

所以,就音节数而言,汉语词平均比英语词长7.14%,然而,考虑到英语一个音节比汉语单音节实际上长得多(即便把上一节得到的17.78%折半,也有8.89%)再加上汉语每音节信息含量大致比英语高3.30%(见第三节数据)从信息论的角度讲,汉语的信息传递效率基本上比英语高

楼主 crysisdoom  发布于 2017-11-23 20:32:00 +0800 CST  
这一点也得到了另一个实验的验证

(见http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3111932/)

这篇论文找了8个汉语使用者和8个英语使用者,然后让他们两人一组。一组之中,一个人描述图片(描述者),另一个人根据描述来绘制(绘画者)。最后对比图片的准确度,同时观察描述者的语言。

最后结果是,汉语描述者明显比英语描述者先开始描述,描述者开始描述与绘画者开始绘画之间的时间差,汉语使用者低于英语使用者,绘画时间,汉语绘画者低于英语使用者,整体时间,汉语组显著低于英语使用者,汉语组所有都比英语组快,而且越复杂的绘画,汉语组就快得越多。

绘画结果,144次绘画。汉语组平均每次犯8.1个错误

其中描述者平均每次犯3.7个错误,绘画者犯4.4个错误

英语组平均每次犯13.25个错误

其中描述者平均每次犯8.5个错误,绘画者犯4.75个

两者的差距仍然在统计误差之内。所以并不算显著

(嗯,是谁说汉语没有英语精确来着?)

楼主 crysisdoom  发布于 2017-11-23 20:33:00 +0800 CST  
之后,为了考虑绘画者的技巧差异,让每个绘画者直接对照原图绘画。结果【汉语】组反而慢于【英语】组。绘画期间,汉语组使用音节数显著少于英语使用者,两组语速(每秒音节数)接近(这个结论与前面的播音速度分析结果一致)。

这虽然是一个初步的实验,但是还是能看出汉语在交流上的优势的:用词更少,时间更短,描述精确水平差不多(如果不是更高的话)这个实验还说明了……我国人民美术水平还有待提高……

楼主 crysisdoom  发布于 2017-11-23 20:34:00 +0800 CST  
至于欧洲主要其他语言,根据第三节提到的数据,它们发音频率比英语高,信息密度比英语低,要那些语言在这方面超过汉语,我觉得可能性不大。

楼主 crysisdoom  发布于 2017-11-23 20:34:00 +0800 CST  
六、组词逻辑

由于英语单音节词资源比较丰富,但平均发音长度较长,所以你会注意到英语里单音节词比例高于汉语,而多音节词的使用比例就小于汉语,很多逻辑上非常相关的词由于不得不全部挤入有限的单音节词库,其发音就失去了联系。这就导致英语的常用词往往【缺乏】组词的逻辑

比如我们可以很轻松地说“公鸡”、“母鸡”、“小鸡”、“鸡蛋”

而英语里就成了“Cock”、“Hen”、“Chick”、“Egg”,毫无联系

如果常用词要建立联系,那么英语就必须提高这些单词的音节数,那么平均词长就要上升,从信息论角度讲,信息传递效率就更低了,所以【英语】只能在组词的逻辑性上进行妥协

相比之下,汉语就从容的多了,即便在当前这种信息效率下,汉语仍然能保证绝大多数词语构造具有逻辑性,因此相比于英语词汇,【汉语】词汇就比较容易记忆,这就产生了一个结果,那就是汉语的常用词汇量远远多于英语。

楼主 crysisdoom  发布于 2017-11-23 20:35:00 +0800 CST  
英文使用者的单词量和生词辨识能力可见1995年的以下论文:http://jlr.sagepub.com/content/27/2/201.full.pdf

其中,大学生平均自称单词量为16141,经过多项选择测试发现,平均能够辨识其中71%的词汇,也就是说平均大学生词汇量估计为11460个单词。老年人平均自称单词量为21252,经过多项选择测试,发现平均能辨识其中80%,也就是说老年人的词汇量大致为17002,对于从未见过的词的正确理解概率,大学生为30%,老年人为39%

没找到中国的相关研究,不过这里是商务印书馆的《现代汉语常用词表(草案)》http://wenku.baidu.com/view/51636fec551810a6f5248676.html

大家可以进去看看自己的词汇量,我感觉大学生达到五万应该不成问题。而且这肯定不是一个人的全部单词量,不过这里面有些词是英语里几个词合起来的,所以中国人词汇量未必比美国人高这么多,但我觉得定性的结论还是可以下的

另外里面可能有你没见过的词,可以看看有多少你猜不出正确含义……我觉得除了极少数,确实没什么难度……

楼主 crysisdoom  发布于 2017-11-23 20:36:00 +0800 CST  
另外,汉语和英语都各自在组词上有一个弱点

汉语有大量的【同音词】例如“攻击”和“公鸡”

英语有大量的【多义词】英语的Ball既可以是球也可以是舞会

汉语中,曾经在文言文中大规模使用的单音节多义词现在大多变成了双音节单义词,汉语中真正的多义词(各个意思之间没有直观逻辑联系)是极少数。而英语里的同音词也是极少数,可以说这两种语言在各自的发展路径上都做了妥协。

楼主 crysisdoom  发布于 2017-11-23 20:36:00 +0800 CST  
由于英语多义词比例比较大,所以尽管英语使用者词汇量比汉语使用者低,也不能说明英语的描述能力不如汉语,另外,美国大学生的词汇量远低于老年人,这说明他们并不是已经记下了所有能见到的词汇,而是在那个年龄段,还没有足够的时间记下。因此可以看出,英语一词多义很多的原因,很可能就是英语单词的记忆难度比汉语大。

总的来说,由于汉语精简了发音,并且每音节信息密度较高,这使得汉语可以有较长的平均词长,因此组词逻辑相比于英语就有了一定的优势,至于其他主要语言,信息传递效率与汉语相比差距更大。主要方面都无法相比,这种次要方面就不需要再比了。

楼主 crysisdoom  发布于 2017-11-23 20:37:00 +0800 CST  
七、强劲的抗噪能力

前面讲到,英语依靠大量的单音节词才能够接近汉语的信息传递效率。但这不是没有代价的。构造大量的单音节词,就需要在词汇中使用大量的辅音

辅音分为两种

一种属于【响音】,就是能够持续发音的,诸如m、n、ng

(除这类辅音外,所有的元音也都是响音)

一类叫做【阻碍音】阻碍音本身发音短促、强度低、音高也很低

只有当阻碍音与元音结合,才能发出强度比较大的音。

楼主 crysisdoom  发布于 2017-11-23 20:38:00 +0800 CST  
汉语普通话中,所有阻碍音都是与元音结合的,而英语以及欧洲所有拼音语言,都大量使用了不与元音结合的阻碍音,事实上,古汉语中不与元音结合的阻碍音是极度常见的,音节结构比现代汉语的诸多方言都复杂,但是后来这种辅音用法就基本淘汰了

具体上古汉语的发音案例,大家可以自行搜索 《關雎》上古漢語朗讀

虽然学界对上古汉语的具体发音还有很多争议

但古汉语音节的复杂度在那个朗读中体现得很好。

楼主 crysisdoom  发布于 2017-11-23 20:39:00 +0800 CST  
消灭独立的阻碍音,首先加快了发音速度,第二保证所有音都具有很高的强度。但是其代价就是大大缩小了单音节词库,不过在上面的比较中我们可以看出,这个代价是值得的,汉语的信息传递效率仍然非常高。

那么我们继续一个前面提到的话题,是不是音调越多越好呢?

楼主 crysisdoom  发布于 2017-11-23 20:39:00 +0800 CST  
有一个搞笑论调是这么说的 "我们的普通话叫“mandarin”,什么意思啊? 满大人,满族人清朝入关之后,说不出我们的口语,他就把很多调去掉了,把入声去掉了。说的发音越来越简单了,然后逼着全国人都这么说,所以我们现在的口语比粤语要简单得多

这是一个非常愚昧的论调

首先,Mandarin 这个英语单词来自于葡萄牙语 mandarim 葡萄牙语这个词又来源于马来语m?nt?ri 马来语这个词来源于梵语mantrin 而梵语这个词的意思是官员

换句话说,mandarin的愿意是【官话】

而且Mandarin这个词能查找到的最早的记录出现于1589年

大家可以查查那时候“满大人”在哪里呢

楼主 crysisdoom  发布于 2017-11-23 20:40:00 +0800 CST  
很多人以为粤语是正宗的汉语发音,这话对,也不对。粤语具备一些中古汉语的发音特征。但是它也是在【中古汉语】的基础上发展而成的,语音还是有相当大的差异

有人认为北方官话/中原官话的形成,是因为蛮族入侵“污染”了汉语,这个说法同样,对,也不对。北方官话之所以在中古汉语的基础上进一步的发展,就是因为战争与征服。北方汉民与语言不通的外族加深的了交流,多种族的融合,教育,逐渐把一些发音变得更加容易。

楼主 crysisdoom  发布于 2017-11-23 20:41:00 +0800 CST  
举一个例子,粤语里白菜的白是Baak,普通话是Bai 粤语里尾部的这个k是一个不发音的舌头动作,这个动作略微改变了原来Baa的发音,但这个音,如果不费力就很难造成Baa明显的变化。相比之下,Bai本身就容易发,双元音ai的发音是通过舌头跟随下颚动作完成的。我们知道咀嚼肌的力量比舌头大,运动也快,依靠下颚完成的ai音显然比依靠舌头完成的aak音要容易发,当然这不是一个公平的比较。相比之下普通话Liu、Lang的发音难度与粤语Baak相近,但是这两个音的尾部都是响音,不需要费力就能发得很清楚。

楼主 crysisdoom  发布于 2017-11-23 20:42:00 +0800 CST  
与这个不发音的k类似的,还有粤语中p和t结尾,这种发音方式正式名称叫做不除阻的【塞音尾】在亚洲很多国家和方言里都有,这应该是【古汉语】流传下来的特点,这种【塞音尾】既不抗噪也不省力,在交流更广泛、更频繁的北方方言里是很难见到的,应该是已经演化成其他发音了

粤语依具体方言不同,有6-10个声调,其音高变化模式并不超出普通话的四个音调,之所以多出来这么多音调,是因为粤语还引入了不同基准音高,比方说在一些方言里,粤语的第1、3、6声都是保持音高,但是这三个声调各自保持的音调高度不同。再比如粤语第2、5声,都是音高由低到高变化,但起始音高不同,粤语总共有四种不同的基准音高,分别是do、re、mi和sol,类似的情况在很多南方方言里都存在。

这就是为什么有时候南方方言听起来有些像唱歌,大概也就是为什么吴侬软语听起来很好听。

楼主 crysisdoom  发布于 2017-11-23 20:43:00 +0800 CST  
然而粤语音调最大的问题就是,每一个人音调高低是不一样的。有的人说话音调高,有的人音调低,没有一个统一标准,甚至同一个人说话的时候,在低沉、平静、激动时,音调高低也是不同的,因此,与一个不熟悉的人说话,出现单独的一个音高或两个音高,都很难分辨出到底是哪一声,必须要三到四个基准音高都繁出现,才能判断准确对方的音高究竟属于哪一声。而这些基准音高是否会频繁出现,这就是比较看人品的了

当然,就汉语的冗余度而言,一部分音高判断不准是没有太大关系的

但这就让粤语发音多变的优势大大削弱了。

楼主 crysisdoom  发布于 2017-11-23 20:43:00 +0800 CST  
此外,粤语的7、8、9声都是短促音,其音高和音高变化模式与1、3、6声没有区别,短促音抗噪能力不如普通音长的发音,但它们的发音速度更快,不过在现今人类口语交流中,瓶颈是大脑的思维速度,发音速度太快并没有明显的好处

有人问到底多少个声调最合适,我觉得这很不好说。现在没有客观的评估,但是无论如何有声调的汉语(及其方言)总是要比没有声调的外语强。

楼主 crysisdoom  发布于 2017-11-23 20:44:00 +0800 CST  
那么汉语的抗噪性能有没有什么证明呢?

有的。出了国,尤其是到了欧美的人,就会发现一个问题。那就是中国人说英语,相比于当地人来说,总有点含混不清。外语老师总是要求中国人说英语的时候嘴巴要张大、舌头的运动要有力,甚至要求用牙齿咬住一根铅笔来训练唇舌运动

这是为什么呢?因为中国人已经习惯了唇舌微微运动的发音过程。

汉语发音具有很高的信号强度,而且由于舍弃了所有单独发音的辅音,所以一个音节里的元音就能保持更长的时间(这也就是为什么我们一般觉得汉语说话比英语慢的缘故)我们知道长时间保持一个信号,也有利于对抗随机噪声。发音强度大、元音维持时间长,这就导致,同等发音强度时,汉语的抗噪能力更加强大。

换句话说就是,同等噪音条件下,汉语所需要的音量更小。

因此汉语使用者发音不必费力,唇舌运动幅度比英语之类明显小。

楼主 crysisdoom  发布于 2017-11-23 20:44:00 +0800 CST  
八、口语的速度

说到口语的速度,我们先来看这篇论文:http://ldc.upenn.edu/myl/llog/icslp06_final.pdf

图1显示,根据一些谈话样本,当去掉沉默与噪音占据的时间后

英语会话者每分钟一般能够说160-280个词

汉语会话者大致是250至400词(这里不是字)

这差不多是普通人不受思绪影响的最高语速

所以可以看出,汉语的理论最高信息传递能力是【远远高于】英语的。

但实际上受限于【思维速度】,两者的速度差距并不大。

楼主 crysisdoom  发布于 2017-11-23 20:45:00 +0800 CST  
下面这篇论文研究了在不同语速下听众正确听得每个字的概率http://www.sciencedirect.com/science/article/pii/S0169814104001581

英文播音平均每分钟210-252个音节与汉语播音平均每分钟240-260字没有显著区别。可以说,人类接受语音的速度,现在是受到了【人脑处理能力】的限制。上面的播音速度,都不是播音员最快的说话速度,而是为了保证观众正常收听才控制的速度

随着交流的日益深入,人类说话的速度实际上在加快,40年前美国一般语速是145词每分钟。如今是160-170词每分钟,中国60年代播音185字每分钟,如今是240-260字每分钟,这也许是信息的丰富让人脑的处理能力上升的缘故。

楼主 crysisdoom  发布于 2017-11-23 20:46:00 +0800 CST  

楼主:crysisdoom

字数:15171

发表时间:2017-11-24 04:17:00 +0800 CST

更新时间:2020-09-07 22:19:41 +0800 CST

评论数:142条评论

帖子来源:百度贴吧  访问原帖

 

热门帖子

随机列表

大家在看