- 1、本文档共85页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机 主要内容 5.1 文本及文本处理 5.2 数字声音及应用 5.3 图像与图形 5.4 图像处理软件Photoshop概述 5.5 数字视频及应用 5.6 动画处理软件Flash概述 5.1 文本与文本处理 5.1.1 字符的编码 5.1.2 文本的获取 5.1.3 文本的常见格式 文字处理是计算机应用的基础 传统的文字处理过程 计算机文字处理过程 文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体 文本由一系列 “字符”(character)组成,每个字符均使用二进制编码表示 文本在计算机中的处理过程是: 5.1.1. 字符编码 文字的基本元素是字母和符号,统称为“字符” (character),它包括:字母、数字、标点、符号等 字符集:一组抽象字符的集合,是常用字符的集合 不同的字符集包含的字符数目与内容不同,如: 中文字符集、西文字符集、日文字符集等 字符的编码: 字符集中每个字符的二进位表示,称为该字符的编码或代码(code) 不同的字符其编码各不相同 字符集中所有字符的编码的一览表,称为该字符集的码表 1、 ASCII码——西文字符的编码 西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成 美国标准信息交换码(ASCII码): ASCII字符集包含96个可打印字符和32个控制字符 采用7个二进位进行编码 计算机中使用1个字节存储1个ASCII 字符 存在问题: 字符集太小(只有128个字符) 不同国家和地区使用不同的字符集及其编码,互不兼容 东亚地区使用的大字符集无法编码 2、扩充ASCII字符集 ISO陆续制定了一批适用于不同地区的扩充ASCII字符集,每个扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均是高位为1的8位代码(十进制数128~255),称为扩展ASCII码。 3、汉字的编码 汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素,有多个国家和地区使用(中、日、韩、新、马······) 汉字的特点 数量大;字形复杂,同音字多,异体字多 如何编码? 确定收入多少字、哪些字? 在字符集中如何排列? 使用多少个二进位进行编码? 常用的汉字编码字符集 国家标准GB2312-1980 汉字扩充规范 GBK 国家标准GB18030-2005 台湾地区的标准汉字字符集CNS 11643 (BIG 5,俗称“大五码”) 日本工业标准汉字字符集JIS X 0208-90 韩国国家标准汉字字符集KSC 5601-87 UCS/Unicode多文种大字符集 (1) GB2312汉字编码字符集 1980年颁布《信息交换用汉字编码字符集·基本集》 —GB2312-80 GB2312字符集由三个部分构成: GB2312汉字的编码 每一个GB2312汉字使用16位(2个字节)表示 为了与ASCII字符相区别,每个字节的最高位均为“1” 例如: “南”字的代码11001111 (用十六进制表示为C4CF) (2)其他五个辅助汉字集 1984年,全国计算机与信息处理标准化技术委员会提出编码字符集的繁体字和简体字对应编码的原则,做出了制定六个信息交换用汉字编码字符集的计划。 这六个集均采用双七位编码方式,分别命名为: 基本集(GB2312-80):简体字集 第一辅助集:基本集的繁体字映射集 第二辅助集:简体字集 第三辅助集:辅二集的繁体字映射集 第四辅助集:简体字集 第五辅助集:辅四集的繁体字映射集 (3)区位码、国标码和机内码 区位码:字符的代码表为94×94的表,行号(0~93)为区号,列号(0~93)为位号。 该字符所在的区号(行号)及位号(列号)的二进制代码(7位区号在左,7位位号在右,共14位)即为区位码。 每个汉字在码表中的位置编码,称为区位码。 国标码:由于信息传输的原因,汉字的区号和位号必须加上32所得的二进制代码才是其对应的国标码。 国标码=(区码+32,位码+32) 机内码:在计算机内部,汉字以两个字节来表示一个汉字,为和ASCII码区别,其最高位为1。该码称为汉字的机内码,又称内码。 练习1 练习2 解答 思路:区位码——》国标码——》机内码 步骤: 1)“江”——2913 29为区号 13为位号 2)国标码:区号、位号分别+32 区号:29+32=61= (0011 1101) 2 位号:13+32=45=(0010 1101) 2 3)将字节的首位设为“1”——》机内码: 1011 1101 1010 1101 B D A D
文档评论(0)