论简体字之不科学,不可行

to 播火者
句的加长,可能是因为白话文兴起带来的。但是在古代,白话文并没有排斥文言文。市井小说用白话文,正式古文,文章典籍用文言文。就好像美国人街头巷议用俚语,正是场合用规范的英语。我觉得这是个比较好的做法。

但是我现在并没有说要恢复文言文,这个毕竟走的太远了。我是说,因为我们的简体字在简化合并的过程中丢掉了好多信息。比如必须写“头发”“发展”,否则别人不知道你在说发的哪个意思。比如说“礼”字里面看不出礼法,祭祀的意思,所以我们在用“礼”字表达这个意思的时候要多花些笔墨强调一下。这都是一种浪费。

说到标准化,我认为我们的标准化在与六书,只要和六书符合的字,都不会难以记忆。实际上古代和外国都是有一个字有好几个写法的事情,也没见有多大问题。这可能是为了保持文字的活力和趋向于最优,所必须付出的代价。就好像西方社会,总有人滥用民主自由。

to 红色浪子
连coding theory都没学好的恐怕就是阁下你本人。因为英文信源发出的是字母,中文信源发出的是汉字。所以你只能用字母对比汉字。实际上比较字母,汉子,还是单词,都没什么区别的。因为最后我们要比较的是两篇含有同样信息的文章的压缩过后的长度。coding theory没学好不要紧,你可以再学。但是这个没有想清楚的话,那整个人就算是废掉了。另外一个问题是,我们是不可以比较笔划的,因为这种信源模型实在太复杂了。

to zengerl
不可行的意思是最终会失败的意思。就好像说法西斯主义是不可行的。

to supsonic
http://zhongwen.com/d/174/x103.htm,这里有射的意思。我觉得这是个非常有用的网站。大家都可以去看看。

to machan
国家规定常用汉字是6000多。你居然可以用几百个汉字搞定日常交流。你一定是语言学家,那个发明了三点水+九代表酒的语言学家。

to TakeIt
感谢你的错误发言,让我确信这里这里反对我的人基本上都是没什么知识并且不懂裝懂,希望我的直率不会让你勉為其難。

1,文字所表达的内容叫做信息。但是文字本身是信号。就好像图像是信号,电压电流是信号一样。实际上你可以把一篇文章看做从信号源发出的一串符号,或者说n次随机试验。

2,熵编码,講的不是怎麼把常用的信息簡化,因为要表达的内容里的信息含量是不会随着表达方法的改变而改变的。就好像你说“今天是星期三”,或者你说“明天是星期4”,或者你说“今天是星期三,并且明天是星期4”。这三句话的表达方法不一样,但是信息含量是一样的。

那么熵编码做什么呢?它根据每个信息出现的概率,给每个信息分配简繁不一的符号。如果一个信息出现的次数多,那就意味着这个信息含量小,那么就分配一个简单的符号,反之亦然。以便用最省的符号,表达相同的信息的目的。

3,很显然,我们从没有看到简体字的创造者对所有繁体字的出现次数做过统计,然后根据这个次数来创造简体字。所以简体字肯定不符合熵编码。

这全是最基本的功夫,希望你不要一误再误了。
楼主 巴比伦的清教徒  发布于 2004-08-04 22:02:07 +0800 CST  
大哥,你真厉害,这么快就被你看出来了,我是学管理的,这玩艺是自学的。但是你总不能说老师不教就是没有吧。或者老师教完了你全忘了?你千万不要告诉我你是老师,或者准备做老师,那我就劝你的学生还是象我一样自学吧。

按照你的指示,我用google搜了一下,结果如下:
书 名: 通信信号处理
作 者: 张贤达 保铮
出版社: 国防工业出版社
版 本: 2002-3-1
页 数: 609页
尺 寸: 精装16开
原书定价: ¥ 66.0
目录
。。。
第八章 信源编码与信道编码
8. 1 信源的数学模型与信息测度
8. 1. 1 信源的数学模型
8. 1. 2 熵与平均互信息
8. 2 离散和模拟信源的编码
8. 2. 1 离散无记忆信源的编码
8. 2. 2 离散平稳信源的编码
8. 2. 3 模拟信源的编码
8. 3 信道编码的基本概念
8. 3. 1 信道容量
8. 3. 2 检错与纠错
8. 4 线性分组码
8. 4. 1 分组码的性质
8. 4. 2 生成矩阵与奇偶校验矩阵
8. 4. 3 几种典型的分组码
8. 5 卷积码
8. 5. 1 卷积码及其表示
8. 5. 2 卷积码的译码
。。。
见http://216.239.41.104/search?q=cache:drc0sSXMNGMJ:www.welan.com/html/bookinfo_6066.Html+%E4%BF%A1%E5%8F%B7%E5%A4%84%E7%90%86%2B%E7%86%B5%E7%BC%96%E7%A0%81&hl=zh-CN
你想说什么?是不是通信信号处理就不算信号处理?

那没关系,再给你找一篇。
图像编码基础和小波压缩技术——原理、算法和标准
书号: 7-302-07746-0
页码: 340
开本: 16开 版次:1-1
丛书名:
出版社: 清华大学出版社
出版日期: 2004-3-1
本书系统地介绍了静止图像和视频序列编码的基本原理、算法和国际标准,分成相对独立的两部分。第一部分介绍了构成图像编码器的各种基本技术,包括熵编码、量化、预测、变换、运动补偿预测等,这是构成大多数图像编码国际标准的核心技术,其中第4章概括了各种图像编码标准的主要特点。
见http://www.china-pub.com/computers/common/info.asp?id=18176
你是不是又想说图像处理和视频处理都不算信号处理?

那再给你看一个吧。
统计与自适应信号处理
Statistical and Adaptive Signal Processing
出版社:电子工业出版社
原出版社:McGraw-Hill
译作者:[美]Dimitris G.Manolakis等著 周正等译
出版日期:2003年5月
上架时间:2003-06-28
系列名:国外电子与通信教材系列
定价:65¥
目录
。。。
第9章 信号建模和参量谱估计
。。。
9。2。3 最大熵方法
。。。
见http://216.239.41.104/search?q=cache:tik2oGU6C44J:www.huachu.com.cn/itbook/itbookinfo.asp%3Flbbh%3DBD99663485+%E4%BF%A1%E5%8F%B7%E5%A4%84%E7%90%86%2B%E7%86%B5%E7%BC%96%E7%A0%81&hl=zh-CN
这些全是我用google搜的,请笑纳。

再来一本
视频处理与通信
我手头的书
电子工业出版社
Yao Wang
Jorn Ostermann
Ya-Qin Zhang
目录
。。。
第8章 视频编码基础
。。。
8。3 信源编码的信息理论
。。。
连老外都不给你面子,我也没办法了。

关键是,所谓编码,当然是对信号的值进行编码,难道你可以直接对信息进行编码?
楼主 巴比伦的清教徒  发布于 2004-08-05 00:58:18 +0800 CST  
要不你再来讲点huffman coding的理论?让我们看看你对这么司空见惯的东西会有什么让大家吃惊的见解?
楼主 巴比伦的清教徒  发布于 2004-08-05 01:04:35 +0800 CST  
或者说说你是怎么很顯然的看出来簡体字符合熵编码的原則?
楼主 巴比伦的清教徒  发布于 2004-08-05 01:06:17 +0800 CST  
to TakeIt
应该絕倒的是我吧。你叫我拿出哪怕一本讲述熵编码的信号处理书,我就把这些书拿给你看,结果你现在又不认账。至此你的三个问题统统不成立,而你又这样顽强的屹立不倒,那只有我自己絕倒了。实际上我很困惑,在信号处理,尤其是压缩领域,变换编码和熵编码是密不可分的,很多时候这两部分都编在同一本书里,你怎么就不明白?

to 红色浪子
非常欢迎你慷慨的让大家分享你的惊人发现:“中文一个字就可以表示至少一个意思,是最基本的完整信息载体。”,那么你告诉我“葡”表示什么意思?“萄”表示什么意思?“桌椅”和“桌子椅子”的意思有什么不同?“蒲公英”里的“蒲”“公”“英”都分别表示什么意思?他们各自的意思和“蒲公英”这个意思有什么联系?还有“干部”,“逻辑”,“英特那雄尔”之类的,你都给说说这些词里的每一个字的意思,都对表达该词的意思做出了什么样的贡献吧。

不过实际上,我并没有觉得汉字和英文字母在表达信息方面是对等的。这只是你对我的猜测。我只是认为在可以检测方面,汉字和英文字母是对等的,都是可以检测的最小信号单位。至于你说的笔划和字母对等,我非常期待你能在这方面做出开拓性的成果,因为我还没有看到第二个人会疯狂到这个地步。试想一下:一个英文信源不断的发射字母,这些字母信号连起来就是一片有意义的文章;一个中文信源不断的发射汉字,这些汉字信号连起来也是一片有意义的文章。难道你能想象一个奇怪的信源在不断的发射笔划,那连起来除了是一堆笔划外还会是什么?一堆笔划可以表达信息吗?

或者照你的意思把汉字和英文单词相对应?但是我看不出这样做有什么好处。因为人们会以汉字为单位对中文信号编码,但是我还没看到有谁会为单词为单位对英文信号编码。希望你能介绍一些这方面的有意义成果。

而且我从来就没说过huffman编码,因为它是一阶的,而文字显然是高阶熵。实际上真正的做法是对字符串进行处理,以便利用高阶熵,比如lzw算法,根本就没人用huffman,所以我也不会说huffman,我只是建议在比较汉语是否比英文节省的时候,使用winzip等软件,因为这些软件代表了目前人们对高阶熵的最高认识。现在让我们高呼口号:“在这个贴子里,第一个提到huffman的是傻逼。”

你只有一个说对了,要写这个,确实要有10几篇论文做参考。实际上领导现在给我的任务只不过是小小的vca,我花了大半个上午就下载了13篇,还不包括一篇在ieee网站的,因为它问我要35美元,我叫我在学校的师弟帮我下,他那里好象不要钱。这年头,好像不是非要上学才能看到论文吧。

to zhangfan81
我可没有拉虎皮做大旗啊。我从来就没有一口一个“美国的master”,一口一个“huffman coding”。我从来不会说自己都搞不懂的东西,而且我也没有学过《通信信号处理》,这只是我在网上搜到的书,因为我的工作是视频处理算法,和通信无关。既然你把它说的那么神圣,大不了我以后绝对不看这本书就是了,免得你心里不平衡。
楼主 巴比伦的清教徒  发布于 2004-08-05 21:28:27 +0800 CST  
不好意思,高阶熵是个很旧的名词,而且我几年前就学会了。从任何意义上说,它都是旧的。实在不知道它新在何处。

你给我的任务就是找本带有熵编码的信号处理书。我实在不知道image processing不算signal processing,講濾波器的signal processing也不算signal processing,写了signal processing还非要算成標準的信息系統的書。这种白马非马甚至指鹿为马的事情超出了我的智商,恭喜你,你赢了。

顺便说一下,我里面有本书讲的是video processing而不是image processing。在我们这行,这两个词是严格区分的,这两个领域只有一小部分交叉。
楼主 巴比伦的清教徒  发布于 2004-08-05 22:17:01 +0800 CST  

楼主:巴比伦的清教徒

字数:12467

发表时间:2004-08-01 01:00:00 +0800 CST

更新时间:2016-11-27 22:43:12 +0800 CST

评论数:198条评论

帖子来源:天涯  访问原帖

 

热门帖子

随机列表

大家在看