漢字输入技术与方法.docVIP

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
漢字输入技术与方法

第三章 汉字输入方法 ? 文字录入是中文信息处理的第一步,它可以借助三种手段来实现,即键盘输入、汉字字形识别和汉字语音识别。 ? 在这三种方式中,汉字的键盘输入是主流的输入方式,而汉字字形识别输入和语音识别输入是汉字输入发展的一个趋势,将来的输入技术将是一个多元化的格局。 第三章 汉字输入方法 第一节 汉字键盘输入 ? 汉字的键盘输入可分为两种基本的形式: ? 一是通过专用的大键盘来进行整字的输入,其效率低下,成本高,已经基本不用。 ? 二是通过标准的PC 键盘(小键盘)来进行输入,显然,要完成输入过程,就必须对汉字进行编码,因此小键盘的输入是一种编码输入。其效率高、成本低,已经成为主流的输入方式。 第一节 汉字键盘输入 ? 如前所述,依据编码的思路不同,可将编码分为流水码、拼音码、拼形码、音形结合码四类。 ? 每一种编码都有其特点,在键盘输入方面,目前的格局是职业打字员使用形码(如五笔字型),非职业打字员使用音码(如全拼),音码向智能化方向发展,相对形码而言优势越加明显。当前音码的主要不足是不能实现盲打。将音字转换从语句级拓展到篇章级可以解决盲打问题。因而可以肯定∶音码输入加智能转换,将成为未来键盘输入的主流。现在主要的问题在于如何提高转换精确度。 第一节 汉字键盘输入 ? 汉字键盘输入系统是由编码层次和软件层次两部分构成,这两个层次互相补充,互为依托,构成完整的输入系统。从“高频先见”、“联想”到“自动识别重码字、词”,软件智能化的程度在不断提高。 ? 赋予计算机一定的有关汉字、汉语的语法、语用知识,计算机可根据这些知识来取代原来需要人脑记忆的某些编码规则,辨别同音字和人工选定重码字、词或联想字、词。 第一节 汉字键盘输入 ? 一、流水码的代表:内码输入法 ? 内码输入法是Windows 内置的一种输入法,它支持区位码、GBK内码、UNICODE码三种方式的输入。 第一节 汉字键盘输入 ? ? 区位码的前二位是区码,后二位是位码。区的编码是从 01-94,位的编码也是从 01-94。在区位码输入方式下,键入相应的区码和位码就可以输入一个汉字。汉字是从 16 区到 87 区,01 至 15 区是图形符号和字母。 区位码输入支持《信息交换用汉字编码字符集 -- 基本集》即 GB2312-80 的内码输入方式。内码编码的范围为:0xA1A1~0xFEFE。 ? GBK内码输入覆盖了汉字扩展内码规范 -- GBK 中规定的全部汉字。 ? UNICODE码输入支持《通用多八位编码字符集 (UCS) 》- 国际标准ISO/IEC10646.1-1993中规定的全部汉字。 第一节 汉字键盘输入 ? ? 可以输入所有的汉字,包括所有的符号,和内码一一对应,只要内码支持多少汉字,它就可以输入多少字。如在Office XP 的简体中文版中,可以达到对6 万多汉字的输入支持。 ? 对于不认识字的字也可以输入,可以通过 偏旁部首对照表 来进行 ? ? ? 安装Office XP 简体中文版,Microsoft 在中文简体版Office XP及相应多语言包中,专门开发了超大字符集中文字体(宋体-方正超大字符集)及增强型区位码。 ? 宋体-方正超大字符集字体包括了27,564个汉字以及在第二平面中(42,711)选出的36,862个在中国大陆,香港特别行政区(以及部分台湾地区)使用的汉字。因此包括西文等常用字符在内,宋体-方正超大字符集共包括65,531个字符。 ? 宋体-方正超大字符集中包括了6万4千多汉字,但是由于其中相当多的汉字读音很难确定,使得按拼音输入的方法难以实现。为此,微软公司专门扩展了原区位/内码/Unicode输入法,开发了增强型区位码。对于GBK中的汉字(即在Unicode 中U+4E00~U+9FFF),用户可以继续按原来的方式输入(通过输入区位码,GBK内码或Unicode码)。但是对于扩展A的汉字只能通过输入Unicode码,对于扩展B只能通过输入一种4字节的Surrogate码。总之,通过增强型区位码用户不仅可以输入GBK的汉字,而且可以顺利输入扩展A及扩展B的汉字。 ? 用户只需就要查找汉字在《康熙字典》(或《汉语大字典》)中相应的页码(《康熙字典》的xxxx.xxx或《汉语大字典》的xxxxx.xxx),并在有哪些信誉好的足球投注网站中将该页码字符串作为关键字进行有哪些信誉好的足球投注网站,找到相应的Unicode或Surrogate,然后激活增强区位输入法即可进行输入。 ? 《康熙字典》页码格式为:xxxx.xxx 《汉语大字典》页码的格式为:xxxxx.xxx。这里特别要注明的是这里数据来源于1958年1月第一版的《康熙字典》。 ? 这里小数点前为该汉字在字典中

文档评论(0)

fglgf11gf21gI + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档