1. 1、本文档共21页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数字识别

课程设计目的 提高分析问题、解决问题的能力,进一步巩固数字图像处理系统中的基本原理与方法; 掌握文献检索的方法与技巧; 熟悉掌握一门计算机语言,可以进行数字图像的应用处理的开发设计。 2.方法综述 2.1数字识别与BP网络的概述数字识别前景广阔,广泛应用于表格中数字的识别、汽车牌照的数字自动识别和成绩单的识别等多个项目,如对邮政编码、财务报表、银行票据、各种凭证以及调查表格的识别等等,实现数字的自动识别给人们提供了很大的方便。 BP算法全称为反向传播算法,是一种监督式的学习算法。其工作原理主要由两部分组成:信息的正向传递与误差的反向传播。首先由输入矢量按照网络的运算规则计算出实际输出矢量,然后将它与目标矢量进行比较得出网络误差,即BP算法信息的正向传递过程;再利用网络误差平方和来逆向调整网络各层权值和阈值,从而降低网络误差平方和,即BP算法的反向传播原理。 BP网络是一种多层前向网络,网络除了输入输出点外,还有一层或多层中间节点。输入层是一组变量,输入层和中间层(也叫隐含层)之间,中间层和输出层的每两个节点之间都有一个连接权,输出层是目标向量。 由于神经网络具有很强的自适应学习能力;较强的容错性,能够识别带有噪声或变型的输入模式;并行分布式信息存储与处理能力,识别速度快;能把若干预处理和识别处理融为一体来进行等特点,对于识别手写体数字来说,采用神经网络是一种有效的手段。 BP网络数字识别研究历史与现状利用BP网络来对对象进行识别之前,应先对待识别对象样本进行预处理,即将手写数字二值化,然后对其进行特征提取,将所提取的特征输入到神经网络进行识别,最后输出并显示识别结果。 预处理 进行特征提取前先对手写数字进行了二值化、行字切分、平滑、去噪声、规范化和细化等预处理,然后对其进行特征提取。有以下几种方法: 1)序列化法。其方法是将图像均匀分解成m×n个小块,每个小块内进行如下判断:如果块内有“黑点”就记为1,否则就记为0。如此一行一行地处理,共有m×n个点。这m×n个点就是我们作为BP网络的输入点。 2)全局阈值法。全局阈值法根据文本图像的直方图或灰度的空间分布确定一个阈值,并根据此阈值实现灰度文本图像到二值化文本图像的转化。图像点阵区域进行行(X轴)、列(Y轴)方向上的投影,分别得到横向和纵向的黑像素的统计直方图。字符点阵区域在直方图上呈现出波峰状,而字符间的空隙在直方图上呈现出波谷状。图像的细化操作采用模板匹配的方法,针对当前处理的像素点逐个与预设的模板比较,从而确定当前点的状态。 3)灰度转化法。把图象中各象素点的值由灰度值转化为0、1两个值中的一个,图象由灰度转化为黑白。为减少转化过程中的信息丢失,在图象二值化之前,采用一定的算法对灰度图象进行分析,以确定是否会在二值化中产生小内孔或笔划断开、丢失,并预先在可能出现的部位进行增强,然后再进行二值化处理。 特征选取与提取数字是由弧线和直线构成的,弧线的弯曲方向和程度不同,字符形状不同。但是同一类不同形状的字符,它的端点数及其方向,凸点数及其方向,三叉点数和四叉点数基本上是稳定的,而这些特征反映了数字的结构,是数字的重要特征。以下是一些其他特征: 1)Legendre矩全局特征 矩特征是广泛使用的统计特征之一,反映了字符图像点阵总体分布情况,具有平移、尺度和旋转不变性,一些最基本的二维形状特征都与矩有直接的关系。 2)字符点阵拓扑综合特征 字符点阵的拓扑特性是对字符的直接描述,系统提取的拓扑综合特征主要有:字符内环路特征;环路中心垂直位置特征;局部极值特征;字符轮廓附加信息特征;宽度特征等。 3)轮廓方向特征 轮廓方向特征表示字符图像的轮廓点在水平、垂直、左对角线方向、右对角线方向等四个方向上的统计特征。统计正方形子区域中归属四个方向的象素点数目,根据有多少象素属于对角线左方向、对角线右方向、水平和垂直方向,构成四维特征向量。 (4)骨架结构特征 对手写数字原始字符图像进行细化,获得数字的骨架特征。计算骨架点的局部特征,包括端点、三叉点、四叉点,以及笔画方向特征,从而形成一个多维的特征向量[12]。 字符识别系统一般分为预处理、特征提取和分类器三部分。其中,预处理包括将图片从模拟图像到进行二值化、字符分割、归一化等过程;特征提取和分类器的设计是整个系统的核心部分。通过对各个部分分别进行编程处理来实现,将每部分编为可调用的函数,最后统一对函数进行调用,清晰方便。下面分别对每部分模块实现进行介绍。 图1 整个实验的流程图 3.1.1预处理模块 由于扫描输入的图像一般为RGB格式,预处理首先需要将其转化为二值化的图像,即只包含“0”、“1”的矩阵形式。先将原始图像转化为灰度图像,通过函数rgb2gray来实现,再通过函数im2bw转化为二值图像,然后对二值化

文档评论(0)

zhuliyan1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档