深度学习--人脸识别.ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
●Related works for feature learning 1. Learning-based descriptors 2. Deep models ● Network Architecture Deep Learning Identity-Preserving Face Space Xianhao Gan PCA是将分散在一组变量上的信息集中到某几个综合指标(主成分)上的数学方法,实际上起着数据降维的作用,并保证降维过程最大化保留原数据的差异。 这对最大化类间差异(即不同人之间的差异)并最小化类内差异(即同一人的不同图像间的差异)很有效 用PCA将2维数据降到1维的例子,绿色点表示二维数据,PCA的目标就是找到这样一条直线,使得所有点在这条直线上的投影点之间的平均距离最大。也就是最大化地保留了原数据的差异性。 本征脸(eigenface)方法 是人脸识别的基准技术,并已成为事实上的工业标准, 该方法基于主成分分析(PCA) 本征脸方法 如果将本征向量恢复成图像,这些图像很像人脸,因此称为“本征脸”。 [M. Turk A. Pentland, JCN91] 本征脸法认为图像的全局结构信息对于识别最重要,将图像看做矩阵,计算本征值和对应的本征向量作为代数特征进行识别,具有无需提取眼、嘴、鼻等几何特征的优点,但在单样本时识别率不高,且在人脸模式数较大时计算量大。 本征特征(eigenfeature)方法 利用PCA分析眼、鼻、嘴等局部特征,即本征特征方法 [R. Brunelli T. Poggio, TPAMI93] [A. Pentland et al., CVPR94] 这实际上相当于:为若干重要的特征建立本征空间,然后将多个本征空间集成起来 本征脸 vs 本征特征 本征脸利用全局特征,本征特征利用局部特征,二者各有优势 待识别图像 本征脸识别结果 本征特征识别结果 [A. Pentland et al., CVPR94] 本征脸 vs 本征特征 (2) (1) (3) (4) 难题——能否自动确定: 该用哪些特征?(眼睛?鼻子?嘴?……) 特征的确切位置在哪儿?(从哪儿到哪儿算眼睛?……) 将二者结合,可以得到更好的识别效果 同样,这实际上相当于:为若干重要的特征建立本征空间,然后将多个本征空间集成起来 由于嘴部受表情影响很严重,因此未考虑嘴部特征 深度模型(Deep models) ●受限波尔兹曼机RBM ●深度信念网络DBN ●卷积受限波尔兹曼机CRBM ●混合神经网络-受限波尔兹曼机CNN-RBM ……. “深度模型”是手段, “特征学习”是目的! 深度学习 1.什么是深度学习? 2.深度学习的基本思想 3.深度学习的常用方法 1)自动编码机(AutoEncoder) 2)稀疏编码(Sparse Coding) 3)受限波尔兹曼机(Restrict Boltzmann Machine , RBM) 什么是深度学习? 2006年,加拿大多伦多大学教授、机器学习领域的泰斗Geoffrey Hinton和他的学生RuslanSalakhutdinov在《科学》上发表了一篇文章,开启了深度学习在学术界和工业界的浪潮。 深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本,它是无监督学习的一种。 深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。 深度学习的基本思想 假设我们有一个系统S,它有n层(S1,…Sn),它的输入是I,输出是O,形象地表示为: I =S1=S2=…..=Sn = O,如果输出O等于输入I,即输入I经过这个系统变化之后没有任何的信息损失。 深度学习的常用方法: 1.自动编码机(AutoEncoder) Deep Learning最简单的一种方法是利用人工神经网络的特点,自动编码器就是一种尽可能复现输入信号的神经网络。为了实现这种复现,自动编码器就必须捕捉可以代表输入数据的最重要的因素,就像PCA那样,找到可以代表原信息的主要成分。 1)给定无标签数据,用非监督学习学习特征 2)通过编码器产生特征,然后训练下一层。这样逐层训练: 稀疏自动编码器( Sparse AutoEncoder ): 如果在AutoEncoder的基础上加上L1的Regularity限制(L1主要是约束每一层中的节点中大部分都要为0

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档