网站大量收购闲置独家精品文档,联系QQ:2885784924

4.2汉字的表示与汉字编码.PDF

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
4.2汉字的表示与汉字编码.PDF

4.2 汉字的表示与汉字编码 汉字的输入对于使用汉字的人来说,是一项必不可少的工作。我国的计算机研究人员已 成功地开发了多种汉字输入法,将汉字以一定的规则进行编码,在输入汉字时,只要输入该 汉字的编码字符,就能输入对应的汉字。 4.2.1 汉字字形的表示 计算机在处理汉字时,先根据汉字的机内码,取出对应的汉字字形码,得到该汉字的点 阵字形,再由点阵字形来输出该汉字。 点阵字形就是以点阵方式来表示的汉字字形,是一种以网格来描画字形的方法。由于汉 字是方形的,所以点阵都是正方形的。 目前计算机使用的汉字字形大多采用16×16 点阵,也就是将一个正方形分为横向的 16 格与纵向 16 格,从而在相应的网格上描画汉字。16×16 点阵的每列用两个字节存储,每个 汉字字形占用 32 个字节。 点阵的大小影响着汉字字形的质量,点阵越大,即点阵越密,汉字的笔画表示得就越清 晰,因而汉字的质量就越高,但它所占用的存储空间也就越大。所以,汉字信息处理系统在 确定汉字点阵的同时,也要考虑存储容量及设备的成本等因素。 4.2.2 汉字代码 汉字代码包括汉字输入码、汉字交换码、汉字机内码、汉字地址码、汉字字形码和汉字 控制功能码六种。一个汉字从输入到输出,首先要用汉字的外码将汉字输入,其次是用汉字 的内码存储并处理汉字,最后用汉字的字形码将汉字输出。汉字编码转换过程如图4-3 所示。 汉 汉 汉 字 字 字 输 机 字 入 内 型 码 码 码 输入设备 输入处理 汉字库 输入设备 图4-3 汉字编码转换过程 1.汉字输入码 目前的键盘输入法种类繁多,而且新的输入法不断涌现,各种输入法各有各的特点,各 有各的优势。随着各种输入法版本的更新,其功能越来越强。目前的中文输入法有以下几类: (1)对应码 对应码又称为流水码。它是将被编码的汉字按一定的顺序排列,依次编排一个号码,这 个号码便是这个汉字的编码,这样形成的汉字编码就称为流水码。因为每个汉字只有一个编 码,所以重码率几乎为零,效率高,可以高速盲打,但缺点是编码与汉字的属性 (即字音、 字形、字义)没有直接的关系,因此这种编码较难记忆和掌握,而且没有什么太多的规律可 言。 常见的流水码有区位码、电报码、内码等,一个编码对应一个汉字。 这种方法适用于某些专业人员,比如,电报员、通讯员等。但在电脑中输入汉字时,这 类输入法已经基本淘汰,只是作为一种辅助输入法,主要用于输入某些特殊符号。 (2 )音码 音码其编码规则与音素有关,它是根据汉字的读音属性来对汉字进行编码,因此只需具 有汉语拼音的基础即可掌握,不需要特殊记忆,符合人的思维习惯,只要会拼音就可以输入 汉字。但拼音输入法也有缺点:一是同音字太多,重码率高,输入效率低;二是对用户的发 音要求较高;三是难于处理不识的生字。 例如,全拼双音、双拼双音、新全拼、新双拼、智能ABC 、洪恩拼音、考拉、拼音王、 拼音之星、微软拼音等;台湾的注音、忘型、自然、汉音、罗马拼音等;香港的汉语拼音、 粤语拼音等。 这种输入方法不适于专业的打字员,而非常适合普通的电脑操作者,尤其是随着一批智 能产品和优秀软件的相继问世,中文输入跨进了” 以词输入为主导” 的境界,重码选择已不再 成为音码的主要障碍。新的拼音输入法在模糊音处理、自动造词、兼容性等方面都有很大提 高,微软拼音输入、黑马智能输入等输入法还支持整句输入,使拼音输入速度大幅度提高。 (3 )形码 形码是按汉字的字形 (笔画、部首)来进行编码的。汉字是由许多相对独立的基本部分 组成的,例如,” 好” 字是由” 女” 和” 子” 组成

文档评论(0)

tangtianbao1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档