网站大量收购独家精品文档,联系QQ:2885784924

第2章信息编码与数据表示.ppt

  1. 1、本文档共77页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章信息编码与数据表示剖析

信息编码的概念 前面介绍的计算机中数值数据的各种编码 带符号数的编码方法:原码、反码和补码 整数和实数的编码方法:定点和浮点表示法 都具有值的含义,可以在计算机中进行运算 下面介绍西文字符编码和汉字字符编码 (西文)字符编码 常用西文字符:英文字母,数字字符、标点符号和控制字符等,共128个字符 ?在计算机中,要为每个字符指定一个确定的二进制代 码,作为识别与使用这些字符的依据 由于西文字符与二进制整数之间没有什么必然的联系,某一个字符究竟对应哪个整数完全可以人为地规定 由于编码是一个涉及世界范围内有关信息表示、交换、处理、存储的基本问题,因此都以国家标准或国际标准的形式颁布施行 字符编码有多种,应用最广泛的是ASCII码 ASCII American Standard Code For Information Interchange 美国标准信息交换码。这一编码最初是由美国制订的,后来由国际标准化组织(ISO)确定为国际标准字符编码 为了和国际标准兼容,我国根据它制定了相应的国家标准,即 GB1988 ASCII码的编码规则 用一个字节(8位二进制数)表示一个字符的编码 0 余下的7位可给出128个二进制编码 即0000 0000-0111 1111 可以表示128个字符 最高位取“0” ASCII码的编码规则 规定:每个字符用7位二进制数来表示,7位二进制共有128种状态(27= 128 ),可表示128个字符;即7位编码的取值范围为0000000~1111111 在计算机内,每个字符的ASCII码用1个字节( 8位)来存放,字节的最高位( d7)为校验位,通常用“0”来填充,后7位(d6d5d4d3d2d1d0)为编码值 7位编码的ASCII码字符集包括了128个字符,称为标准的ASCII码字符集 ASCII码表 编码 字符 第0到31 控制字符(32个) 第48到57 0~9的10个数字符号 第65到90 26个英语大写字母 第97到122 26个英语小写字母 其余 标点符号、运算符号等 第127 控制字符(1个) b7b6b5b4 b3b2b1b0 0000 0001 0010 0011 0100 0101 0110 0111 0000 NUL DLE SP 0 @ P ` p 0001 SOH DC1 ! 1 A Q a q 0010 STX DC2 “ 2 B R b r 0011 ETX DC3 # 3 C S c s 0100 EOT DC4 $ 4 D T d t 0101 ENQ ANK % 5 E U e u 0110 ACK SYN 6 F V f v 0111 BEL ETB ‘ 7 G W g w 1000 BS CAN ( 8 H X h x 1001 HT EM ) 9 I Y i y 1010 LF SUB * : J Z j z 1011 VT ESC + ; K [ k { 1100 FF FS , L \ l | 1101 CR GS - = M ] m } 1110 SO RS . N ^ n ~ 1111 SI US / ? O _ o DEL ASCII字符与编码对照表 例 已知字符“X”的ASCII码为 0101 1000 求字符“s” 的ASCII码 0101 1000 的10进制数为88(64+16+8) 88+32-5=115 转换为2进制数为 0111 0011 汉字编码 (自学) 包括: 信息交换码(国标码) 区位码 内码 输入码和输出码 输入码 国标码 内码 字形码 汉字输入 汉字输出 各种代码之间的关系 汉字的二进制编码 用ASCII码不能完整表示汉字 常用汉字约有5000个 汉字和汉字字符是一个庞大集合 汉字及汉字字符的编码由国家定义,以GB强制性发布执行 汉字的二进制编码规则 用两个字节表示一个汉字字符,可定义255*255个汉字或汉字字符 考虑到与ASCII码的兼容和统一、留出控制字符等因素 每个字节的最高位取0 预留出0到32号和127号的控制字符(共34个) 确定字节的有效取值为 33—126(对应的十六进制数为21H—7EH) 可“独立”表示 94*94=8836 个汉字字符 0 0 216=65536, 214=16384 图示 国标GB-2312-80 称为信息交换码;又称为国标码 共收录7445个汉字及图形符号: 一般符号: 202个; 序列号: 60个 数字: 22个;英文字母52个、日文假名169个

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档