手写体数字识别.ppt

下载文档 降价啦

174
0
约4.25千字
约 10页
2017-05-27 发布于湖北
举报
版权申诉
保障服务

手写体数字识别.ppt

1、本文档共10页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

手写体数字识别精要

手写体数字识别设计流程图像预处理图像采集特征提取分类识别统计识别率导入图像图像切分灰度化二值化边缘检测粗网格特征 BP神经网络膨胀导入图片选择数字图像切分预处理灰度化图像用rgb2gray函数二值化采用阈值判定法。阈值选择用最大类间方差法。直接用graythresh函数。边缘检测采用Canny算子。膨胀用函数imdilate实现。特征提取识别 * * Imcrop函数 * 预处理包括灰度化rgb2gray ，二值化im2bw ，边缘检测，图像的膨胀。0表示黑，255表示白。二值化的具体方法很多，常用的是阈值判定法。也就是说给定一个阈值，当灰度图像中像素点的亮度值小于该值时，把像素点设置成黑色，而当灰度图像中像素点的亮度值大于该值时，把像素点设置成为白色（或者黑色、其它颜色）。阈值的选取方法主要有最小均方差法，最大类间方差法，最佳阈值搜寻方法，迭代阈值选取方法等。本软件采用的是最大类间方差法graythresh 。这种方法首先选取一个初始值当做阈值，按初始阈值将像素点分成背景和目标两部分，然后比较目标和背景的类间方差，类间方差最大的时候取得最终的阈值。边缘检测的目的是找出图像中亮度发生了巨大变化的点。边缘检测可以减少数据量，去掉一些不相关的信息，加快运算速度，提高运行速率。Iedge = edge(uint8(Ibw) Canny算子的综合性能比较好，不仅定位精度较高，而且可以更好的滤除噪声，降低噪声影响，提高整体性能[10]。图像的膨胀imdilate 的目的是扩大物体的边界，可以将断裂的部分连接起来，即使书写不准确补充完可以识别出来。边缘检测主要分为平滑滤波、锐化滤波、边缘判定、边缘连接等步骤。边缘检测的算法分为两类：基于查找的算法和基于零穿越的算法。除了这些方法，还有Canny边缘检测法、统计判别方法。 Canny算子的综合性能比较好，不仅定位精度较高，而且可以更好的滤除噪声，降低噪声影响，提高整体性能[10]。 * unit8类型的最小值是0。除了具有高度的结构元素外，实际应用中使用更多的是一种平坦（高度为0）的结构元素，这种结构元素只能由0和1组成，为1的区域指明了运算涉及的范围。 Canny算子的综合性能比较好，不仅定位精度较高，而且可以更好的滤除噪声，降低噪声影响，提高整体性能[10]。 Iedge = edge(uint8(Ibw)) * 从特征自身的特点上可以将其分为两大类，一种是它的外形特征，另一种是比较深层的纹理特征，这个特征可以表现表面的灰度变化。将粗网格特征提取方式具体点来说就是：第一要先把数字按像素点分成许多N*N型的一个个的网格，第二就是将每个网格中所包含的图像的所有的像素个数（统计灰度值为0的元素的数量并计算其占总数的比例，得出点阵密度）然后将收集计算的结果当做这个网格的特征的信息，接着在识别的时候，把所有的网格的特征的信息结合在一起，就得到了一个N*N维的各个网格特征的分布情况的图像。最后将得出的网格特征作为描述整个数字的统计特征。首先要将输入的图像转变成50*70的特征矢量，然后将每10*10大小所包含的点加在一起聚合成为一个点，计算每一个10*10大小的范围内的所有图像象素的数量，计算每一个像素占所有像素数量的比例，并将其当做这个特征的数据信息，因为图像的尺寸是50*70，所以我们把它分成7×5的网格，每10*10大小范围内包含的所有数据信息当做一个特征，总共可以得到35个特征。然后将特征工业化。粗网格特征提取方法的好处是化整为零，将整体分为部分，一个网格的特征出现错误时，对整体的影响并不是很大。 * BP 神经网络的训练过程主要是：首先创建一个具有一个隐含层的网络，给这些神经细胞的权重随意赋一个很小的实数值。然后把一个输入样本输入进去，然后将输出值算出来。求出这个输出值与标准输出值的误差，并根据这个误差调整输出单元的权值，使得误差不断减小。这个训练要对所有的不同的样本进行多次实验，直到误差降到一个可以接受的范围内，这时训练就结束了。BP 算法包含两部分的内容：信息的正向传递与误差的反向传播上[13]。在进行正向传播时，输入到其中的信息从输入层出发通过隐含层一层层的计算并将其传到输出层，每一层所包含的神经元的状况仅仅会影响下一层所拥有的神经元的情况。假如输出层的结果并不是希望得到的结果，就需要去算出输出层对应的误差转变了多大，接着进行反向传播，依靠网络让误差信号按照正向传播时的路线返回去，然后修正每一层神经元的权值，已达到缩小误差的目的，一直到输出结果符合要求。将“