《汉字点阵字库的建立与提取》技术指导书.doc

《汉字点阵字库的建立与提取》技术指导书.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《汉字点阵字库的建立与提取》技术指导书

《汉字点阵字库的建立与提取》 技术指导书 基本知识: 1、汉字输出码 汉字无论字形如何变化、笔划多少都可以写在方块中 一个方块可以看作m行n列的矩阵,称为点阵,汉字的点阵字形在计算机中称为字模 汉字经过点阵的数字化转换成数字,称为汉字的输出码 一个字节有8bit,m*n点阵的阵列可以用m*n/8个字节表示 存储空间根据选择点阵的不同而不同,点阵的行列数越多汉字越精细,但存储空间越多 2、GB2312编码 1、GB2312是一个简体中文字符集的中国国家标准,由中国国家标准总局发布,1981年5月1日实施。 GB 2312通行于大陆、新加坡等地。几乎所有的中文系统和国际化的软件都支持GB 2312。 它是一个简化字的编码规范,当然也包括其他的符号、字母、日文假名等,共7445个图形字符,其中汉字占6763个。我们平时说6768个汉字,实际上里边有5个编码为空白,所以总共有6763个汉字 GB2312规定“对任意一个图形字符都采用两个字节表示,每个字节均采用七位编码表示”,习惯上称第一个字节为“高字节”,第二个字节为“低字节”。 GB2312将代码表分为94个区 ,对应第一字节 ;每个区94个位,对应第二字节。 GB2312字符集构成一个94行、94列的二维表,行号称为区号,列号称为位号,每一个汉字或符号在码表中的位置用它所在的区号和位号来表示。 为了处理与存储的方便,每个汉字的区号和位号在计算机内部分别用一个字节来表示。例如,“学”字的区号为49,位号为07,它的区位码即为4907,用2个字节的二进制数表示为:00000111 用十六进制数表示即为3107H 区位码无法用于汉字通信,因为它可能与通信使用的控制码(00H~1FH)(即0~31)发生冲突。ISO2022规定每个汉字的区号和位号必须分别加上32(即二进制,经过这样的处理而得的代码称为国标交换码,简称交换码,因此,“学”字的国标交换码计算为: ------------------------------- ? 用十六进制数表示即为5127H 由于文本中通常混合使用汉字和西文字符,汉字信息如果不予以特别标识,就会与单字节的ASCII码混淆。此问题的解决方法之一是将一个汉字看成是两个扩展ASCII码,使表示GB2312汉字的两个字节的最高位都为1。这种高位为1的双字节汉字编码即为GB2312汉字的机内码,简称为内码。 因此,“学”字的机内码为:10100111 用16进制表示即为D1A7H 3、汉字点阵编码定位公式 (C1-0xa1)*94 + (C2-0xa1) ,其中C1为机内码高位字节,C2为机内码低位字节 4、常用函数 字体创建函数CreateFont 字符显示函数TextOut 屏幕行扫描函数GetPixel 三、设计要求 1、尽量使用C语言,源程序要有适当的注释,使程序容易阅读; 2、要有用户界面。要求至少采用文本菜单界面;鼓励采用图形菜单界面; 3、使用文件保存数据; 基本参考模版: 通过本课程设计,巩固C语言软件编程能力,熟悉掌握C语言开发工具,了解软件任务项目的开发过程。本课程要求设计一个转换工具,能够把WINDOWS中的多种汉字矢量字库(宋体,楷体,黑体等)转换成方块点阵字库。 课程内容 程序必须可以方便的选择不同的WINDOWS矢量字库; 文件生成的方块点阵字库必须以二进制的文件格式进行存储; 目标文件按照GB 2312格式存储; 文件生成的不同尺寸(16, 20,24,32,48)大小的目标方块点阵必须能够通过程序进行来选择; 程序可以调整生成的汉字字库的汉字字数; 程序在字模转换提取的过程必须能同时显示同一个字的矢量字模与点阵字模的效果; 程序必须显示版本内容,包括论文作者、学号及编译日期 鼓励自行增加新功能,比如增加文本输入,点阵字模放大处理等等; 三.设计要求 1、尽量使用C语言,源程序要有适当的注释,使程序容易阅读; 2、要有用户界面。要求至少采用文本菜单界面;鼓励采用图形菜单界面; 3、使用文件保存数据; 4、写实验报告(要求正规打印,A4幅面),内容包括: 题目 系统功能模块结构图 数据结构设计及用法说明 程序结构(画流程图) 各模块的功能 体会 参考文献 附录:程序清单及源程序软盘 5、凡发现抄袭,抄袭者与被抄袭者皆以零分计入本课程设计成绩并向学院报告。凡发现实验报告或源程序雷同,涉及的全部人员皆以零分计入本课程设计成绩并向学院报告。 四.参考书目 《C语言程序设计》谭浩强等编,清华大学出版社 《C程序设计上机指导》谭浩强主编,清华大学出版社 《C语言贯

文档评论(0)

pangzilva + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档