卷积神经网络CNN.ppt

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

ConvolutionalNeuralNetworks

卷积神经网络

主要内容卷积神经网络—诞生背景与历程卷积神经网络应用—LeNet-五手写数字识别深度学习—Hinton做了些什么深度学习在数字图像识别上的运用—Hinton如何在二0一二年ImageNet引起轰动

卷积神经网络提出的背景浅层神经网络大约二三十年前,神经网络曾经是机器学习领域特别热门的一个方向,这种基于统计的机器学习方法比起过去基于人工规则的专家系统,在很多方面显示出优越性.

卷积神经网络提出的背景但是后来,因为理论分析的难度,加上训练方法需要很多经验和技巧,以及巨大的计算量和优化求解难度,神经网络慢慢淡出了科研领域的主流方向.值得指出的是,神经网络[如采用误差反向传播算法:BackPropagation,简称BP算法,通过梯度下降方法在训练过程中修正权重使得网络误差最小]在层次深的情况下性能变得很不理想[传播时容易出现所谓的梯度弥散GradientDiffusion或称之为梯度消失,根源在于非凸目标代价函数导致求解陷入局部最优,且这种情况随着网络层数的增加而更加严重,即随着梯度的逐层不断消散导致其对网络权重调整的作用越来越小],所以只能转而处理浅层结构[小于等于三],从而限制了性能.

浅层神经网络的缺陷于是,二0世纪九0年代,有更多各式各样的浅层模型相继被提出,比如只有一层隐层节点的支撑向量机[SVM,SupportVectorMachine]和Boosting,以及没有隐层节点的最大熵方法[例如LR,LogisticRegression]等,在很多应用领域取代了传统的神经网络.显然,这些浅层结构算法有很多局限性:在有限样本和计算单元情况下对复杂函数的表示能力有限,针对复杂分类问题其泛化能力受到一定的制约.更重要的是,浅层模型有一个特点,就是需要依靠人工来抽取样本的特征.然而,手工地选取特征是一件非常费力的事情,能不能选取好很大程度上靠经验和运气.能不能自动地学习一些特征呢?

卷积神经网络早在一九八九年,YannLeCun[现纽约大学教授]和他的同事们就发表了卷积神经网络[ConvolutionNeuralNetworks,简称CNN]的工作.CNN是一种带有卷积结构的深度神经网络,通常至少有两个非线性可训练的卷积层,两个非线性的固定卷积层[又叫PoolingLayer]和一个全连接层,一共至少五个隐含层.CNN的结构受到著名的Hubel-Wiesel生物视觉模型的启发,尤其是模拟视觉皮层V一和V二层中SimpleCell和ComplexCell的行为.

卷积神经网络应用LeNet-五手写数字识别三大特点:一、局部感受野二、权值共享三、次采样[pooling]

重点概念卷积核[卷积滤波器]特征图[FeatureMap]C层是一个卷积层:通过卷积运算,可以使原信号特征增强,并且降低噪音S层是一个下采样层:利用图像局部相关性的原理,对图像进行子抽样,可以减少数据处理量同时保留有用信息F六层是经典神经网络:输入向量和权重向量之间的点积,再加上一个偏置.然后将其传递给sigmoid函数产生单元i的一个状态.

C一层:输入图片大小: 三二*三二卷积窗大小: 五*五卷积窗种类: 六输出特征图数量: 六输出特征图大小: 二八*二八 [三二-五+一]神经元数量: 四七0七[[二八*二八]*六]]连接数: 一二三0四[[五*五+一]*六]*[二八*二八]可训练参数: 一五六 [[五*五+一]*六]

S二层:输入图片大小: [二八*二八]*六卷积窗大小: 二*二卷积窗种类: 六输出下采样图数量:六输出下采样图大小:[一四*一四]*六神经元数量: 一一七六 [一四*一四]*六连接数: 五八八0 [二*二+一]*[一四*一四]*六可训练参数: 一二 [六*[一+一]]

卷积和子采样过程: 卷积过程包括:用一个可训练的滤波器fx去卷积一个输入的图像[第一阶段是输入的图像,后面的阶段就是卷积特征map了],然后加一个偏置bx,得到卷积层Cx. 子采样过程包括:每邻域四个像素求和变为一个像素,然后通过标量Wx+一加权,再增加偏置bx+一,然后通过一个sigmoid激活函数,产生一个大概缩小四倍的特征映射图Sx+一.

C三层输入图片大小:[一四*一四]*六卷积窗大小:五*五卷积窗种类:一五输出特征图数量:一六输出特征图大小:一0*一0[一四-五+一]神经元数量:一六00[[一0*一0]*一六]]连接数: 一五一六00[六0+一六]*[一0*一0]*二五[部分连接]可训练参数:一五一六 [[六0+一六]*二五][C三中的每个特征map是连接到S二中的所有六个或者几个特征map的,表示本层的特征map是上一层提取到的特征m

文档评论(0)

祝星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档