《计算机第五章重点讲义2).docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《计算机第五章重点讲义2)

第五讲 多媒体 一、文本及文本处理 文本准备(即:文本输入)、文本编辑、文本处理、文本传输、文本展现(即:文本输出)。 二、字符编码 1、ASCII码 以下数据要记住: 96个可打印字符。32个不可打印字符。 字符‘A’的ASCII码值是:65 字符‘a’ 的ASCII码值是:97 数字‘0’字符ASCII码值是:48 一个标准ASCII字符需要7位二进制位表示。在内存中存储时要占用一个字节,即8位,但只用到7位,最高位总是0。 2、汉字编码 ①GB2312-80一共分94区、94位。一级常用汉字有3755个,按汉语拼音排序。二级常用汉字有3008个,按偏旁部首排序。没有繁体字。与ASCII码不兼容(因为:ASCII是最高位为0,而一个汉字是2个字节,它们的最高位都是1) 汉字区位码:汉字‘啊’在16区1位上,故:汉字‘啊’的区位码是:16 01 (两个字节)。区位码是汉字输入码。 汉字国标码:由区位码中的区+32、位+32得到。如:汉字‘啊’的区位码是:16(区) 01(位),则国标码是:48 33 (两个字节)。国标码用于不同系统间交流用。 汉字机内码:是汉字输入到电脑后的编码。在计算机内部处理汉字时,都是使用机内码进行的。国标码每一个字节加上128(即:每一个字节高位置1),就是机内码。 如: 汉字‘啊’的区位码是:16(区) 01(位),则国标码是:48 33 (两个字节)。则相应机内码是:48+128=176 33+128=161 ,因此汉字‘啊’的机内码是:176 161 (两个字节且高位都是1) 归纳:区位码=?机内码:区+160 位+160 区位码=?国标码:区+32 位+32 国标码=?区位码:字节-32 字节-32 机内码=?区位码:字节-160 字节-160 国标码=?机内码:字节+128 字节+128 (等价于高位置1) 机内码=?国标码:字节-128 字节-128 测试:若中文Windows环境下西文使用标准ASCII码,汉字采用GB2312编码,设有一段文字的内码为CB F5 D0 B4 50 43 CA C7 D6 B8,则在这段文字中,含有多少个汉字和多少个西文字符 思路:因为:一个汉字是两个字节且高位都是1. 因此:CB F5(这两个字节CB F5高位都是1,因而是一个汉字) D0 B4 (这两个字节D0 B4高位都是1,因而是一个汉字)50(一个英文字符) 43(一个英文字符) CA C7(一个汉字) D6 B8(一个汉字)。结果:4个汉字,2个英文字符。 ②GBK:在GB2312基础上扩充了大量汉字。包括大量繁体。因此:GBK向下兼容GB2312,保持:一个汉字2个字节,且高位都是1。与ASCII码仍不兼容。 ③GB18030:对UNICODE中的10万个字符重新按我国情况进行编码。向下兼容GBK(自然也就兼容GB2312了)。是不等长编码。即:一个字符或能是1个字节,也或能是2个字节或4个字节。向下兼容ASCII(因为是不等长编码)。与UNICODE不兼容。 ④台湾繁体BIG5: 与所有的GBXXX标准都不兼容。 ⑤UNICODE中的UTF-8编码(与GB18030编码的字符集是一样的,即:字符相同,但编码的方式不同): UTF-8编码也是不等长编码。与GB系列编码都不兼容,但与ASCII码兼容。 测试:P38 三、文本准备 输入汉字的方式有许多种。手工和自动。 汉字键盘输入编码:数字编码、字音编码、字形编码和形音编码,汉字的输入编码与汉字的机内码是不同的概念,同一个汉字可以有多种输入编码,但机内码都是相同的。 汉字OCR输入:将印刷或打印在纸上的中西文字输入计算机并经过识别转换为编码表示的一种技术,这种输入方式适合需要处理大批量文字资料的文档管理、图书情报等应用。 汉字的输出过程:先根据字符的字体选择相应的字型库,再按照该字符的机内码从字型库中取出该字符的形状描述信息,然后按形状描述信息生成字形,再按照其有关属性作必要的变换。 字符的字型描述方法:点阵描述和轮廓描述。点阵描述是用一组矩形阵列的点表示一个字符;轮廓描述是用一组直线和曲线来勾画字符的轮廓,这种方式精度高,字的大小变化时能保持字形不变。Windows中TrueType字库采用的是轮廓描述方法。点阵字形占用字库量大,但使用简单;轮廓字形占用字库量较小,但在输出之前要通过复杂的处理转换为点阵形式。 点阵描述空间计算:一个16*16点阵汉字的字型描述,需要多少字节空间?16*16/8=32B 若是一个汉字字型是:24*24,则是24*24/8=72B。归纳:若是一个汉字字型是n*n,则是

文档评论(0)

tiantiande + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档