- 1、本文档共149页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]C备课讲义第2章
使用不同进制的原因 计算机中只使用二进制一种计数制的原因: 二进制中只有0和1两个符号,使用有两个稳定状态的电子器件就可以分别表示它们,而制造有两个稳定状态的电子器件要比制造有多个稳定状态的电子器件容易得多 二进制数的运算规则简单,易于进行高速运算 数理逻辑中的“真”和“假”可以分别用“1”和“0”来表示,这样就把非数值信息的逻辑运算与数值信息的算术运算联系了起来 使用八进制和十六进制的原因: 二进制数太长,书写、阅读、记忆均不便 八进制和十六进制与二进制之间的转换直观、方便 数值信息的表示 计算机中的数值信息分类 整数和实数:它们都是用二进制表示的,但表示方法有很大差别。 实数(浮点数)的表示 实数:既有整数部分又有小数部分的数,整数和纯小数只是实数的特例。任何一个实数总可以表达成一个乘幂和一个纯小数之积,例如: 56.725=102×(0.56725) -0.0034756=10-2×(-0.34756) 指数部分指出实数中小数点的位置,括号里是一个纯小数。 二进制数的情况完全类同,例如: 1001.011=2100×(0.1001011) -0.0010101=2-10×(-0.10101) 字符在计算机中的表示 字符、字符集及其码表 文字的基本元素是字母和符号,统称为“字符” (character),它包括:字母、数字、符号等 字符集:一组特定字符的集合 不同的字符集包含的字符数目与内容不同,如: 中文字符集、西文字符集、日文字符集等 字符的编码: 字符集中每个字符都使用二进位(code) 表示,称为该字符的编码 不同的字符其编码各不相同 字符集中所有字符的编码的一览表,称为该字符集的码表 西文字符的编码——ASCII码 西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成 美国标准信息交换码(American Standard Code for Information Interchange, 简称ASCII码): ASCII字符集包含96个可打印字符和32个控制字符 采用7个二进位进行编码 计算机中使用1个字节存储1个ASCII 字符 存在问题: 7位代码空间太小(解决方案:8位的扩充ASCII码) 不同国家和地区使用不同的字符集及其编码,互不兼容 东亚地区使用的大字符集无法编码 标准ASCII字符集及其码表 汉字如何编码? 汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素 汉字的特点 数量大;多个国家和地区使用;字形复杂,同音字多,异体字多 如何编码? 确定收入多少字、哪些字? 汉字在字符集中的排序方式 确定使用的代码结构和代码空间 常用的汉字编码字符集 国家标准GB2312 汉字扩充规范 GBK 国家标准GB18030 台湾地区的标准汉字字符集CNS 11643 (BIG 5,俗称“大五码”) 日本工业标准汉字字符集JIS X 0208-90 韩国国家标准汉字字符集KSC 5601-87 GB2312汉字编码字符集 1980年颁布《信息交换用汉字编码字符集·基本集》——GB2312-1980 GB2312字符集由三个部分构成: 汉字的编码 汉字编码例 高位字节(7位):qqq qqqq = 0qqq qqqq(区号) 低位字节(7位):www wwww = 0www wwww(位号) 例如:“啊” 区位码: 16 01 = 10 01H 0001 0000 0000 0001 国标码: 30 21H = 10 01H +20 20H 0011 0000 0010 0001 机内码: B0 A1H = 30 21H +80 80H 1011 0000 1010 0001 GB2312汉字编码的不足之处 GB2312汉字字数太少,无法满足一些特殊应用的需要: 人名、地名; 古籍整理、古典文献研究。 没有繁体字 编码效率不高: (6763+682)/65536 与ASCII码不兼容 (2)GBK汉字内码扩充规范 问题:GB2312-80只有6763个汉字,使用时功能不够。 解决方法:1995年发布GBK,全称为《汉字内码扩展规范》GBK字符集中一共有21003个汉字和883个图形符号,它与GB2312国标汉字字符集及其内码保持兼容。 GBK/1:GB2312中的符号;GBK/2:GB2312中的全部汉字; GBK/4和GBK/3:包括繁体字在内的大量汉字;GBK/5:符号。 例如計算機係等繁体汉字和冃冄円冇鎔等生僻的汉字。 组成:21003个汉字,883个图形符号 GBK字符集中的每个字符都采用双字节表示,总的编码范围为8140-FEFE,
文档评论(0)