- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
6汉字操作系统概述 铨【荐】.ppt
汉字操作系统概述 一、汉字操作系统产生的背景 汉字处理是国内包括税务系统常规信息处理的重要内容。MS-DOS是西文操作系统,不具有输入/输出汉字的能力,因此,若要进行汉字处理,必须改造和扩充西文DOS的能力。 早在70年代,我国就开始对汉字信息处理技术进行研究并取得了一定成果。进入80年代后,由于微机的发展,促使汉字信息处理有了重大突破,并研制成功了第一个汉字操作系统,定名为CCDOS。这是由原电子工业部第六研究所在PC-DOS的基础上为IBM-PC及其兼容机开发的操作系统。 随着计算机的发展,汉字系统已经历了三代,最早的CCDOS汉字系统,其基本满足汉字信息处理的要求,但处理速度慢,点阵字模不美观等。发展到第二代,出现了UCDOS、SUPER-CCDOS 2.13等,它们在处理速度上有了很大提高,也有了较为精美的汉字字库。到了第三代,汉字系统已能支持直接写屏,如UCDOS 5.0、CXDOS 6.0、天汇 3.0等。这样,对西文软件无须汉化便能处理汉字了。另外,WINDOWS除了使用中文WINDOWS之外,也可用西文WINDOWS再在其上运行汉字系统解决汉字问题,如中文之星、四通立方RichWin for Windows系列等。这些汉字系统字库更精美、更繁多,功能更强大,使中文信息处理更加迅捷便利。 二、 汉字操作系统如何处理汉字的输入、存储和输出 1.汉字的输入 要进行汉字输入首先要解决汉字的编码问题,主要是汉字在机内如何表示。通常每个西文字符只占一个字节的存储区。但由于汉字的数目众多(属于大字符集),因此需要采取不同的表示方法。 为统一标准,1981年我国公布了《通信汉字字符集及其汉字交换标准》(GB2312-80)。在此方案中,共收录了6763个常用汉字,其中较常用的3755个汉字组成一级字库,按拼音顺序排列;其余3007个汉字组成二级字库,按部首顺序排列。有了这个基本集,就可对这一定数量汉字集内的每个汉字编成相应的一组英文或数字代码,使其能直接使用西文键盘输入汉字。 当前,汉字输入编码已经“出台”的方案有上百种,实际使用的也有几十种,根据编码方案设计时所依据的不同汉字属性,可将它们分成:形码,音码,音形码,区位码。 形码 形码:根据汉字的字形结构来编码。它的优点是:码长(所谓码长是一个汉字编码的字符个数)较短、重码(所谓重码是指同一编码对应多个汉字)率低、直观,不受操作者文化程度高低、是否识字和各地方言不同的影响,只要看到字形,就能按规则击键输入。缺点是:有一套汉字的拆分规则要掌握,字根(若干笔画复合连接交叉,形成相对不变的结构)在键盘上的分布规律要记忆。 音码 音码:根据汉字的读音进行编码。它的优点是:一般学过汉语拼音的人就可以输入汉字,易学,直观,不受字体变化的影响。缺点是:码长较长,重码率高,不会读或发音不准确的字无法用拼音输入。 音形码 音形码:兼顾了汉字的字音、字形(或字义)而构成的汉字输入编码。优点是:吸取了音码和形码的长处,重码率低。缺点是:编码规则复杂难于学习和记忆。 语音输入 中文语音输入技术已经基本成熟 中文的地方语音体系主要有:广东话,闽南话,吴语等 手写输入 从技术发展的角度说,更为重要的是手写板的性能。手写板主要分为三类: 电阻式压力板、电磁式感应板和近期发展的电容式触控板。目前电阻式压力手写板技术落后,几乎已经被市场淘汰。电磁式感应手写板是现在市场上的主流产品。电容式触控手写板作为市场的新力量,由于具有耐磨损、使用简便、敏感度高等优点,是以后手写板的发展趋势。 区位码 区位码:根据汉字在汉字集中的位置而进行编码。优点是:汉字与码组有严格的对应关系,不需进行二次选择。缺点是难于记忆。 现在,我们常见的输入法有。拼音输入法,自然码输入法,表形码输入法,五笔字形输入法等。其方法各异,各有其特点。在众多汉字输入法中还广泛采用了一些辅助手段,如:词组输入,联想输入等,以提高汉字输入的速度。 汉字机内码 汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。 汉字交换码 汉字交换码是指不同的具有汉字处理功能的计算机系统之间在交换汉字信息时所使用的代码标准。自国家标准 GB2312 - 80 公布以来,我国一直延用该标准所规定的国标码作为统一的汉字信息交换码。 2.汉字的存储 在实际汉字系统中,都是用两个字节来表示一个汉字,也即一个汉字对应两个字节的二进制码,也就
文档评论(0)