BP神经网络在ORL人脸数据库中的识别用途.doc

BP神经网络在ORL人脸数据库中的识别用途.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
BP神经网络在ORL人脸数据库中的识别用途

BP神经网络在ORL人脸数据库中的识别用途 人脸识别是当前人工智能和计算机视觉研究的重点之一,有着十分广泛的应用前景,例如身份证识别、信用卡识别以及犯罪嫌疑人的识别等。它的研究涉及模式识别、图像处理、生理学、心理学、认知科学等学科。神经网络是受动物神经系统启发, 利用大量简单处理单元互联而构成的复杂系统, 以解决复杂模式识别与行为控制问题。神经网络中大量神经元并行分布运算的原理, 高效的学习算法以及对人的认知系统的模仿能力等使它极适于解决人脸识别这样的问题。神经网络用于人脸识别已有许多理论文献作了论述。BP 神经网络模型采用误差反向传播学习算法, 将一组输入样本的I/O 问题转变为一个非线性优化问题,可以近似实现从输入到输出的任意连续的非线性映射。本文将BP神经网络用于人脸识别, 建立了人脸识别模型, 通过对输入图像实行图像压缩、图像抽样及输入矢量标准化等图像预处理, 将标准化矢量输入BP 神经网络进行训练, 经过竞争选择, 获得识别结果。 一、BP神经网络的工作原理 反向传播(Back Propagation)神经网络,简称为BP神经网络。标准BP神经网络分3个部分,即输入向量、隐含层神经元和输出层神经元,如图1所示。输入层的处理单元数R等于输入向量分量的个数,隐含层神经元数N可按经验公式来取,输出层神经元数M 取为人脸类别数。BP神经网络的基本工作原理是信号正向传播,误差反向传播,通过对网络权值(,)与阈值(θ)的修正,使误差函数(E)沿梯度方向下降,直到误差低一个预先设定的阈值,才停止训练。 隐含层神经元和输出层神经元的输出分别为: (1) (2) 图1 BP神经网络模型 二、人脸识别步骤 本文以ORL人脸图像数据库为研究对象, 对输入图像进行图像压缩、图像抽样、输入矢量标准化等图像预处理后, 送入BP神经网络训练, 经过竞争选择, 获得识别结果。整个人脸识别系统的流程图如图2所示。下面分别叙述其处理过程。 图2 人脸识别流程图 首先,将ORL人脸库中的人脸图像进行图像预处理。图像预处理包含三个阶段:图像压缩、图像抽样、输入矢量标准化。( 1) 图像压缩。输入图像一般精度比较高, 存在大量的冗余信息。为避免神经网络结构过于复杂, 在输入神经网络之前必须进行图像压缩。图像压缩通常采用插值算法, 包括近邻插值、双线性插值和双立方插值。插值算法的好坏关系到图像的失真程度, 插值函数的设计是插值算法的核心问题。设f(x)表示插值,h(x)表示插值核, 则插值公式为:。式中为权系数。插值核的不同选择形成不同的插值算法。本文的插值核采用双线性插值函数, 插值邻域的大小选为4×4,此时输出像素值的大小为4×4矩阵所包含的有效点的加权平均值。(2)图像抽样。所谓图像抽样即为将压缩后的二维图像矩阵一行接一行拉成一维列矢量, 其目的是便于后续神经网络的输入。(3)输入矢量标准化。图像抽样的输出是一维列矢量, 其元素的值域范围为[0,255]。如果直接将该列矢量输入神经网络进行训练, 由于数值较大, 势必影响计算效率和收敛率。因此, 在将该列矢量输入神经网络之前, 应实行输入矢量标准化。设输入矢量为,输出矢量为,为输入矢量中的最大值, 为输入矢量中的最小值, 则输入矢量标准化过程可描述为=2×-1。显然, 输入矢量标准化是对输入矢量实行线性映射, 将输入矢量中的元素范围由[0,255]转换为[-1,1]之间, 更便于后续神经网络权值与阈值的调节和运算。 其次是提取人脸图像的特征向量。特征提取是模式识别中的分类系统需要解决的一个重要环节,其主要目标是在于获得最优、最显著的特征,同时丢弃无关或次要的信息,降低数据的维数以减低分类系统的复杂性。目前, 提取人脸图像特征向量的方法很多,主要有主成分分析(PCA) 、独立分量分析(ICA) 、Fisher判别分析(FDA)、多维尺度分析(MDS)等线性降维方法和像素提取法、LLE、ISOMAP 等非线性降维方法。本文采用像素提取法,在图像预处理阶段对原始人脸图像压缩的同时,也提取了人脸图像的主要特征。 最后,利用BP神经网络进行人脸识别。BP神经网络用于人脸识别时, 网络的每一组输入对应样本的每一个特征向量,每一个输入节点对应特征向量的每个元素, 而输出节点数等于类别数, 一个输出节点对应一个类。在训练阶段, 如果输入训练样本的类别标号是i, 则训练时的期望输出假设第i 个节点为1, 而其余输出节点均为0。在识别阶段, 当一个未知类别样本作用到输入端时, 考察各输出节点的输出, 并将这个样本类别判定为具有最大值的输出节点对应的类别。如果具有最大值的输出节点与其它输出节点之间的距离较小( 小于某个阈值) , 则作出拒绝判断。 三、实验结果

文档评论(0)

yaobanwd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档