- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
五笔字型的原理与方法
附录一 五笔字型的原理和方法
计算机与汉字编码
五笔字型的原理
五笔字型的字根定义
汉字的五种笔画
识别码的编码方法
五笔字型字根拆分规则
五笔字型的编码方法
五笔字型全码规则
五笔字型简码的编码方法
五笔字型词组编码方法
计算机与汉字编码
计算机是人类迄今为止所创造的最伟大的工具之一。由于计算机是用于帮助我们进行智力劳动的,它又被俗称为“电脑”。计算机的功能强大,应用范围极广,几乎在人类活动的一切领域里都能发挥巨大的作用。然而,要想让计算机为我们人类服务,我们还必须把自己的想法“告诉”它,它才能按我们的要求去工作,并报告工作结果。
在“人—机对话”的过程中,计算机与人“讲话”的方式主要靠的是屏幕的显示和打印,此外也可通过语音设备直接向人“说话”。人向计算机下达指令大致有语音输入、光电扫描和弹击键盘三种方式。随着科学的不断发展,也许还会有更高级的形式出现。不过弹击键盘是人们目前与计算机打交道的主要手段。尤其是处于网络时代,风靡一时的“网上聊天”基本都是靠键盘与远在天边的朋友进行交流。
人们所使用的各种数字、字母、符号和汉字等,都是以点阵组成的不同图形“存放”在计算机的存储器内的,就像排字车间里一排排字架上放着各种铅字一样。排字工人到字架上把需要的铅字拣出、排好,就能表达人们的思想、感情、愿望和要求。使用计算机,我们同样需要“拣字”,不过我们不是去“拣”,而是用光、声或击键的方式“传呼”它们罢了。
字母、数字、汉字等在计算机机内的存储方式,就像人们分别“居住”在标有“门牌号码”的房间里一样。信号传到哪个“门”,那里居住的“居民(字母、数字、汉字)”就应召而至。使用拼音文字的人们可以直接敲击键盘上的键位,也就是说,击某键即为调某符号,键盘上键位的名称(如A)也就是“门牌号”了,就像只有26户的小山村里不必编制门牌号码一样。可是,如果要调动成千上万的汉字就不好办了,谁能记得住这么多“门牌号码”?于是,一大批专家和有志之士都投入到汉字编码的研究中。他们所做的工作就是要给所有汉字编一套新“门牌号码”。这样的号码体系的作用是:使人们可以见字就“想”起它的号码。同时,它们还能在通用的计算机键盘上实现,并且每个字的号码要尽量短,号码要好学、好记。创制出一套编码体系之后,只要把新(汉字输入编码)旧(原来汉字在计算机中存储的房间号码)接通、联系起来就行了,这种接通工作由计算机自动完成。
尽管给汉字编码的工作极其复杂艰巨,但在汉字编码学家的努力下,也取得了很大的成绩。据说,现已发明了上千种编码方案,得到推广应用的也有二十多种。1983年王永民发明的五笔字型汉字录入方法就是最优秀的一种,在国内外的应用范围最广,各种微机和电脑打字机几乎都装有它,甚至在文曲星上输入汉字、在手机上发短消息也可以使用五笔字型汉字录入方法。另外五笔字型输入法不需要拼音知识,见字形即可编码,这一点对拼音有困难的人来说,确实是一个首选输入法。它的快速、便捷,更加吸引了众多中国人成为五笔字型输入法的学习者。
五笔字型的原理
五笔字型的基本原理是:汉字是由若干基本组件构成的,如果给每个组件一个固定的代码,构成一个字的组件的代码就能依次组成代表该字的编码。五笔字型输入法把这些基本组件命名为“字根”,并规定每个字至多只取四个字根。这些字根由计算机键盘上从A到Y的25个键位分别代表。只要连续“弹击”某个字的编码的各键,就能在字库中将其调出来。
这种把汉字拆分为若干元件的思想和方法,在我国已存在了将近两千年。早在东汉时期,文字学家许慎便将汉字分解成了540个基本元件,称为部首。他所著的《说文解字》是汉字拆分的开山之作。后来,四角号码检字法首先将构字成份转化为数字,开创了汉字字形拆分编码的先河。此后相继出现了许多以字典检字为目的的编码方法,这些都为五笔字型等现代计算机汉字编码提供了多方面的经验和借鉴。例如,“五笔”的名称、顺序和范围,“字根”的提出和据以排序的方法等,都产生于几十年前。现有各种编码方案,可以说都是在一定程度上对民族文化遗产的继承和发展。
五笔字型的字根定义
字根是在理论上不可拆分的构成汉字的最小基本元件。在五笔字型的字根中,大部分是笔画简单的汉字和部首,还有少数是新造的笔画的无意义组合。大部分五笔字型教材都说五笔字型大约有125个字根,现在根据传播媒介对五笔字型版权讼案的报道,本书认为五笔字型规定有199个字根。无论多少,记忆这些字根是我们学习五笔字型输入法的关键,也是一个难点。
在五笔字型编码方案中,哪个是字根,哪个又不是,则是人为决定的,并不取决于其本身的性质和在结构上是否“可分”。例如,“言、早、辛、古”等字根在五笔字型中属于不可拆分的,但实际上完全可以按照五笔字型的拆分规则,拆成在五笔字型中实际存在的更小的字根。为了减少字根的总数,五笔字型把大量的部首“拆成了”笔画
文档评论(0)