- 1、本文档共12页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
汉字编码(10.29)解析
汉字编码 何为汉字编码? 汉字编码(Chinese character encoding) 为汉字设计的一种便于输入计算机的代码。 目前汉字输入的途径? 机器自动识别汉字 (难度大) 通过语音识别输入 (难度大) 通过汉字编码输入 (比较现实) 为何难汉字编码实现困难? ①数量庞大; ②字形复杂; ③存在大量一音多字和一字多音的现象。 汉字编码的分类(计算机中汉字的表示也是用二进制编码) 外码(输入码) 交换码(国标码) 内码 汉字的字形码 外码(输入码):将汉字输入到计算机中的一组键盘符号; 交换码(国标码):计算机内部处理的信息,都是用二进制代码表示的,汉字也不例外。而二进制代码使用起来是不方便的,于是需要采用信息交换码。 内码:根据国标码的规定,每一个汉字都有了确定的二进制代码,在微机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码。 汉字的字形码:字形码是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。通常用16×16点阵来显示汉字。 内码? 内码就是汉字在计算机上存储时的编码,比如我们写一个文本文件,内容为 节日快乐,用16进制编辑器打开它,其内容为 BD DA C8 D5 BF EC C0 D6 这里的bd da就是第一个汉字节的内码 汉字编码的标准 1981年,国家标准局公布了《汉字标准交换码》,共分两级,一级3755个字,二级3008个字,共6763个字。 这种汉字标准交换码是计算机的内部码,可以为各种输入输出设备的设计提供统一的标准,使各种系统之间的信息交换有共同一致性,从而使信息资源的共享得以保证。 编码的输入方式 一)整字输入法 二)字形分解法 三)字形为主、字音为辅的编码法 四)全拼音输入法 五)拼音为主、字形为辅的编码法 汉字编码的双轨迹? 汉字信息处理领域中,音码和形码的并存并用,同样是一种双轨制,即汉字和汉语拼音文字并存并用。 汉字编码字符集 注:字符集(Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集 例: ① GB2312-80字符集,中文名国家标准字符集(GB=GuóBiāo国标)。收入汉字6763个,符号715个,总计7478个字符,这是大陆普遍使用的简体字字符集。 ② Big-5字符集,中文名大五码,是台湾繁体字的字符集,收入13060个繁体汉字,808个符号,总计13868个字符,普遍使用于台湾、香港等地区。 ③ ISO/IEC 10646 / Unicode字符集,这是全球可以共享的编码字符集。 等等 * * * 小组:李冠禧 李奕伯 根据 应用 目的 的不 同分 类 点阵代码 内码举例 标0的位置涂黑(背景色),标1的位置涂白(前景色) 优点: 会普通话的人可按音输入,方音重的人可按形输入。 (互补) * *
文档评论(0)