计算机基础理论第3章计算机软件系统幻灯片.ppt

计算机基础理论第3章计算机软件系统幻灯片.ppt

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 中国药科大学计算机教研室 第*页 3.3.2 汉字编码国家标准 计算机处理汉字信息的前提条件是对每个汉字进行编码,这些编码统称为汉字编码。汉字信息在系统内传送的过程就是汉字编码转换的过程。 1 基本集GB2312—80 1981年我国颁布了《信息交换用汉字编码字符集?基本集》(GB2312—80),选取了6763个常用汉字。 一级常用汉字3755个,按汉语拼音排序。 二级常用汉字3008个,以偏旁部首排序。 简体中文常见的编码方式是GB2312,使用两个字节表示一个汉字,所以理论上最多可以表示256x256=65536个符号。 * 中国药科大学计算机教研室 第*页 2. 汉字内部编码问题 区位码:字符的代码表为94×94的表,行号(0~93)为区号,列号(0~93)为 位号。 该字符所在的区号(行号)及位号(列号)的二进制代码(7位区号在左,7位位号在右,共14位)即为区位码。 每个汉字在码表中的位置编码,称为区位码。 国标码:由于信息传输的原因,汉字的区号和位号必须加上32所得的二进制代码才是其对应的国标码 国标码=(区码+32,位码+32) 机内码:在计算机内部,汉字以两个字节来表示一个汉字,为和ASCII码区别,其最高位为1。该码称为汉字的机内码,又称内码。 * 中国药科大学计算机教研室 第*页 在中文Windows环境下,设有一串汉字的内码为CB F5 D0 B4 50 43 CA C7 D6 B8,这段文本中,含有_____ A 、 2个汉字和 1个西文字符 B 、 4个汉字和 2个西文字符 C 、8个汉字和 2个西文字符 D 、4个汉字和 1个西文字符 练 习 C B F 5 1100 1011 1111 0101 一个汉字,两个字节,字节首位均为1 答案:B * 中国药科大学计算机教研室 第*页 练 习 6、已知江字的区位码为2913 ,其机内码是________ A、 6145 B、 3D2D C、 BDAD D、 4535 答案:C * 中国药科大学计算机教研室 第*页 已知苏两字的区位码为4353,其机内码是________ A、 7585 B、 4B55 C、 CBD5 D、 535D * 中国药科大学计算机教研室 第*页 解答: 思路:区位码——》国标码——》机内码 步骤: 1)“江”——2913 29为区号 13为位号 2)国标码:区号位号分别+32 区号:29+32=61= (0011 1101) 2 位号:13+32=45=(0010 1101) 2 3)将字节的首位设为“1”——》机内码: 1011 1101 1010 1101 B D A D 则:BDAD为“江”的机内码 * 中国药科大学计算机教研室 第*页 补:汉字的其它编码方法 GBK Unicode GB18030 BIG5 BIG5编码是目前台湾、香港地区普遍使用的一种繁体汉字的 编码标准 GBK是GB2312的扩展,是向上兼容的,因此GB2312中的汉 字的编码与GBK中汉字的相同。GBK中还包含繁体字的编码 可以用Windows的记事本看一看GBK的编码。 打开记事本写几个字:“在CSDN写Blog”。这里“ANSI” 的意思就是采用系统默认的字符编码方式编码。 用一个16进制编辑器打开保存的文件,内容是: D4 DA 43 53 44 4E D0 B4 42 6C 6F 67 GB18030支持了更多的字符,甚至包括了蒙文,藏文之类。独特 之处在于它向下兼容了GBK,但又扩展了编码空间 * 中国药科大学计算机教研室 第*页 世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。如果有一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码,那么乱码问题就会消失。这就是Unicode,就像它的名字都表示的,这是一种所有符号的编码。 以汉字严为例,Unicode码是4E25,需要用两个字节存储,一个字节是4E,另一个字节是25。存储的时候,4E在前,25在后,就是Big endian方式;25在前,4E在后,就是Little endian方式。 * 中国药科大学计算机教研室 第*页 打开记事本程序Notepad.exe,新建一个文本文件,内容就是一个严字,依次采用ANSI,Unicode,Unicode bi

文档评论(0)

带头大哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档