汉字信息的基础知识.pptVIP

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 汉字输入和办公自动化 4.1 汉字信息的基础知识 4.1.1 汉字的编码 我国汉字编码的发展 汉字编码 国标码:国家规定了标准汉字交换码--GB2312-80(国标码),是计算机及其它设备之间交换汉字信息的统一标准,它为计算机处理的汉字和其它设备处理的汉字之间的交换建立了桥梁。 国标码以94个可显示的ASCII字符代码为基集, 其中任何两个代码组成一个汉字交换码,第一个字节称为区,第二个字节称为位,共组成符号、数字、字母、汉字等7445个,其中汉字6763个, 4.1 汉字信息的基础知识 分为两级。一级汉字3755个,属常用字,按汉字拼音字母顺序排列,二级汉字3008个,属非常用字,按部首排列。GB18030-2000新标准,收录汉字27000多个。 汉字机内码:亦称汉字内部码、汉字机内码。计算机内部处理汉字的代码,与字形表示严格一一对应,不允许出现重码。一般用两个字节表示一个汉字的内码。 汉字输入码(外码):计算机输入的代码,是代表某种输入方法输入某一个汉字的一组键盘符号。也称输入码。目前最常用的输入方法是拼音法和五笔字型法。 同一个汉字的国标码与内部码有一一对应的关系,国标码两字节的最高位都是0,内码就是将这两字节的最高位都变成1,这样,汉字的内码不与英文 4.1 汉字信息的基础知识 字符的编码(ASCII码、EBCDIC码等)发生冲突。汉字的二字节内码与国标码之间的关系:十六进制国标码+8080H=十六进制的内码 汉字输出码:又称汉字字形码或汉字字形发生器。为了输出汉字,将汉字字形经过点阵的数字化后的一串二进制数称为汉字输出码。 4.1 汉字信息的基础知识 4.1.2 汉字信息的存储 汉字字库:汉字的字形数字化后得到了汉字的字形码,并以二进制文件的形式存储在外存储器上,构成了汉字字库,也称汉字字形库。如UCDOS5.0包括下列汉字字库:HZKPSSTJ、KZKPSKTJ等。汉字字库可分为软字库和硬字库两种。 字模:表示产生字形的点阵模式。与字形概念无严格区别。 字体:基本字体有宋体、楷体等,由基本字体变化而来的有长体、扁体等,按笔画不同可分为简体、繁体。ASCII码字符也可分为半角字符和全角字符两种字体。汉字字形的数字化表示:将汉字写在同样大小的方块内,可以将该方块看成m行n列的矩阵, 4.1 汉字信息的基础知识 简称点阵。该矩阵中共有mxn个 点,每个点可以是黑点或白点,黑点组成汉字的笔画,描绘出汉字的字形,称为点阵字型。在计算机中可以用一组二进制数表示一个汉字的点阵,用1表示点阵中的黑点,其余用0表示。 一个16x16点阵汉字需2x16=32个字节存储其输出码,一个24x24点阵汉字则需3x24=72个字节。 4.1 汉字信息的基础知识 4.2 汉字输入方法概述 4.2.1 汉字输入方法 键盘输入 顺序码:、国标区位码、电报码 音码:拼音码 形码:五笔字型码 音形码:自然码 非键盘输入 语音输入 笔输入 扫描识别输入 4.2.2 汉字字符集 国标码字符集(GB2312-80) GBK汉字集 4.2 汉字输入方法概述 4.2.2 汉字输入法的名词术语和屏幕显示 汉字输入法的名词术语 码长:指每个汉字对应的编码长度。静态平均码长指汉字编码长度的平均值;动态平均码长指实际输入汉字编码长度的平均值。例:区位码是定长编码,码长为4。 词组输入法:将词组如同每个汉字一样看待,将其进行编码,按编码直接输入。 重码:指相同编码的汉字或词组多于一个。 提示行:位于屏幕的最下面,主要用于显示输入汉字或词组是键入的编码或重码,以及进行系统设置。 汉字输入法的屏幕显示 半角/全角:半角指一个字符占一个字节的位置;全角是指一个字符占两个字节的位置 重码区:用于显示当前已输入编码所对应的重码内容。 4.2 汉字输入方法概述 输入中文标点:中文标点符号与键盘按键的对应关系见下表 4.3 Windows95的汉字输入方法 4.3.1 Windows95的汉字输入功能 4.3.2 Windows95的汉字输入法 输入法的安装 选用输入法 输入方法的切换 中英文切换(右Ctrl+空格) 汉字输入方法切换(右Ctrl+Shift) 全角/半角切换(Shift+空格) GBK输入法 区位码输入法: 对每一个汉字都对应一个区位编号,区号在前,位号在后,这就是区位码。国标GB2312-80中规定一级汉字3755个,二级汉 字3008个,分布 4.3 Windows95的汉字输入方法 在16-55区、56-87区。1-9 区为间隔符、标点符号、 制表符、数字、字母等。10-15、88-94区为 空区,供用户使用。 4.3.3 智能ABC(标准)输入法 完全遵循标准汉语拼音方案,具有操作简便、自动造字

文档评论(0)

awang118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档