网站大量收购独家精品文档,联系QQ:2885784924

手写数字识别的过程.docVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
手写数字识别的过程.doc

手写数字识别的流程: 1.对所给出的图像进行预处理使得方面后面的数字识别操作,包括图像的二值化等 2.对图像进行图像的形态学操作,让数字变得闭合,方便进行数学形态学的计算 3.用鼠标提取每个数字的图像,并对每个数字图像作出包含连通区域的矩阵 4.根据数字的欧拉数和每个数字的其他不同特征识别数字 5.最后把识别的数字保存起来 下面分别进行论述: 1.数字图像的二值化 原图如下: 二值化处理结果如下: 2.图像的形态学操作,让数字中未闭合的数字6、8、9闭合 处理后的图像如下: 3.用鼠标提取每个数字的图像,并对每个数字图像作出包含连通区域的矩阵 在提取图像时要注意,尽量用最小的矩形包括这个数字,并且不要遗漏数字的任何部分在外面,这一步对后面的识别至关重要,会非常影响数字的识别。提取出来二值图像后,并把它变换成一个数字矩阵,这个矩阵会对图像中不同的连通区域作出不同的标记,这样方便下面进行数字矩阵的特征提取。 4.根据数字的欧拉数和每个数字的其他不同特征识别数字 a.识别数字8,只有8的欧拉数为2 b.识别数字1,其离心率最大(0.9),并且它的最小外包矩形的长度大于宽度的两倍 c.对数字6,其欧拉数为1,用一条水平扫描线从上半部分进行扫描,有两个交点 d.对数字4,其欧拉数为1,用距离右边框几个象素的垂直线与它相交,有两个象素,即可识别 e.对数字0,其欧拉数为1,用一条水平扫描线从中间与它相交,有两个交点,用一条垂直扫描线从中间与它相交,也有两个交点,即可识别 f.对数字9,其欧拉数为1,用一条水平扫描线从下半部分进行扫描,有两个交点,与6相反 g.对数字2,其欧拉数为0,用距上边框十几个象素的水平线与它相交,有4个交点 h.对3,用距中间位置的垂直线与它相交,有3个交点,且欧拉数为0 i.对数字7,其欧拉数为0,从中间位置垂直扫描,有两个交点 j.剩下的就是数字5了 试验结果分析: 总共进行了五组的试验,试验结果如下: b = 1234567895 b = 1534567890 b = 5534567855 b = 1535557895 b = 1555565895 从以上的试验结果可以看出: 如果用鼠标提取图像时,仔细小心的提取,会取得不错的试验效果,但是对于数字2和数字0,往往会有一定的误差。 后三组试验,在提取数字时有意的将数字区域扩大或者缩小,可以看出这样对试验结果的影响很大,会造成很大的误差,这种识别方法的识别率大大降低。 手写数字识别的原理及应用 ??? 一、引言 ??? 手写数字识别是“光学字符识别技术”(简称OCR)的一个分支,它研究的对象是:如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。 ??? 在整个OCR领域中,最为困难的就是脱机手写字符的识别。到目前为止,尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就,但距实用还有一定距离。而在手写数字识别这个方向上,经过多年研究,研究工作者已经开始把它向各种实际应用推广,为手写数据的高速自动输入提供了一种解决方案。 ??? 二、研究的实际背景 ??? 字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉字、英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码、统计报表、财务报表、银行票据等等,处理这类信息的核心技术是手写数字识别。这几年来我国开始大力推广的“三金”工程在很大程度上要依赖数据信息的输入,如果能通过手写数字识别技术实现信息的自动录入,无疑会促进这一事业的进展。因此,手写数字的识别研究有着重大的现实意义,一旦研究成功并投入应用,将产生巨大的社会和经济效益。 ??? 三、研究的理论意义 ??? 手写数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值: ??? 1、阿拉伯数字是唯一的被世界各国通用的符号,对手写数字识别的研究基本上与文化背景无关,这样就为各国、各地区的研究工作者提供了一个施展才智的大舞台。在这一领域大家可以探讨,比较各种研究方法。 ??? 2、由于数字识别的类别数较小,有助于做深入分析及验证一些新的理论。这方面最明显的例子就是人工神经网络,相当一部分的人工神经网络模型都以手写数字识别作为具体的实验平台,验证理论的有效性,评价各种方法的优缺点。 ??? 3、尽管人们对手写数字的识别已从事了很长时间的研究,并已取得了很多成果,但到目前为止机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题。 ??? 4、手写数字的识别方法很容易推广到其它一些相关问题,一个直接的应用是对英文这样的拼音文字的识别。事实上,很多学者就是把数字和英文字母的识别

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档