- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
选题意义和可行性分析计算机的诞生可说是人类历史上一次伟大
选题意义和可行性分析
计算机的诞生可说是人类历史上一次伟大的发明,可是对计算机进一步发掘研究的脚步一直都没有停止过,人们不满足于只让电脑进行计算等一些简单的简单却繁杂的操作,让电脑越来越趋向于会思考的人脑才是科学家们所追求的。
人类从小便开始读书识字,对于电脑来说也要经过先识字的最基础步骤。最早的磁带输入到键盘鼠标输入,都不能直观的显示,所以科学家们像人类一样能识别手写体,这样能让计算机更好的,更快的为人类的生产生活做贡献。仅仅是简单的数字识别在许多领域都有很重要的应用,例如,邮政编码的识别、报表或银行支票上数字的识别以及汽车牌照数字自动识别等。
同样的数字还可分为打印体、手写体等等,识别打印体会比手写体识别容易,但手写体识别更为实用。而后者又分为在线手写体识别和离线手写体识别。在线手写体识别系统通过记录文字图像抬笔、落笔、笔记上各像素的空间位置,以及各笔段之间的时间关系等信息,对这些信息进行处理。而离线手写体的识别相对于在线手写体识别而言,没有笔划信息,因此难度更大、应用更广泛。
由此,慢慢诞生人工智能这一学科,从开始的杂乱无章、不统一到1987年电气和电子工程师学会召开并成立国际神经网络学会,神经网络的理论研究和实际应用进入了一个蓬勃的发展时期[1]。
人工神经元网络是生理学上的真实人脑神经网络的机构和功能,以及若干基本特性的某种理论抽象、简化和模拟而构成的一种信息处理系统。从构造上大致可分为最简单的感知器网络、多层前馈型神经网络、反馈型神经网络和自组织神经元网络等。
由于神经网络具有可并行计算、分布式信息存储自适应和学习能力强等优点,在很多领域获得了极其广泛的应用。尤其是BP网络,即反向传播网络,其应用最为广泛。BP网络是利用非线性可微分函数进行权值训练的多层网络,在函数逼近、模式识别、信息分类及数据压缩等领域得到了广泛的应用。
但是神经网络学习过程的算法在数学计算上都比较复杂,过程也比较繁琐,容易出错。因此,采用计算机辅助进行神经网络设计与分析成了必然的选择。目前,在比较成熟的神经网络软件包中,MATLAB的神经网络工具箱应用最为广泛。MATLAB是矩阵实验室(Matrix Laboratory)的简称,它可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。
国内外研究现状
手写体数字识别时,首先将印在纸上的数字经过光电扫描产生模拟信号,再通过模数转换变成表示灰度值的数字信号输入计算机。纸张薄厚、洁白度、书写力度和笔划质量都要造成字形的变化,产生污点、飞白、断笔、交连等干扰。因此,一般由扫描得到的数值化的字符还需要多种进一步的处理。经过国内外科学家的研究得出结果,一般在输入手写体之后,首先需对图像进行预处理,为特征提取做好准备。
特征提取一般是基于统计的特征选择方法和基于结构的特征方法进行分析。近年来,国内的一些专家学者研究出很多新型的特征提取方法,更有利于精确地识别手写体数字。
根据基于字符整体特征的快速分类方法对手写体能较灵活的进行识别。其原理是根据字符结构提取其凹凸特征。首先,找出字符存在的圈,对于书写时产生的无效圈设定一定的阀值进行判别,把无效圈直接置为字符前景 (像素点设为黑色)。然后,找出字符的凹陷区,如果图像上连接任意两点的直线都属于该图像.那么该图像为凸图像;如果连接图像上两点的直线有部分不属于该图像,那么该图像为凹图像。其中不属于图像部分所在的区域即为图像的凹陷区。最后,再将字符的凹陷区进一步区分为左、右凹陷区。通过上述的字符处理过程,就得到了以字符有效圈、左右凹陷为判断依据的凹凸特征。
另一种新型的特征提取方法为13点特征提取法。13点特征提取方法的总体思路是:首先把字符平均分成 8份,统计每一份黑色像素点的个数作 为 8个特征。分别统计这 8个区域中的黑像素的数目,可以得到8个特征。然后统计水平方向中间两行和垂直方向中间两列的黑色像素点的个数作为4个特征,最后统计所有黑色像素点的个数作为第13个特征。也就是说,画 4道线,统计线穿过的黑像素的数目。特征示意图如图1、图2、图3所示。
图1 8个区域 图2 垂直方向
图3 水平方向
在特征提取之后,选择一种神经网络对手写体数字进行识别。T.F.Pawlicki将多层BP等多种神经网络用于识别手写体数字的实验,在比较实验结果之后,证实了多层网络的分类能力要比其它几种网络好,它在一定的字符集上取得了很好的识别效果。而孙光民等人则利用非线性 PCA神经网络对手写体字符进行识别的研究[7] 。
研究的基本内容与拟解决的主要问题
首先撰写1
文档评论(0)