深度学习PPT资料.pptx

下载文档 降价啦

3
0
约1.71千字
约 14页
2017-04-10 发布于湖北
举报
版权申诉
保障服务

深度学习PPT资料.pptx

1、本文档共14页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

深度学习PPT资料

深度学习 ----许洛深度学习（DL）深度学习（DL） 60、70年代，神经网络（NNs）最早可以追溯的时期，构建出连续非线性层的神经元模型；随后，建立带有梯度下降的BP模型，1981年首次NN得到应用； 80年代末，基于BP训练的深度神经网络（Deep NNs）依然很难实现，90年代开始成为研究主体； 1991，通过无导学习的深度学习（Deep Learning，DL）在实际中可以运用； ?2009，有导师学习的DL在大部分国际模式识别竞赛中领先于其他机器学习方法，并且第一个实现超人视觉模式识别，从此赢得广泛关注。文献参考：Deep learning in neural networks: An overview 深度学习（DL） BP 神经网络（BPNNs）网络存在的主要问题： 1. 一般要得到较好的训练效果，隐层数目不能太少，当图片大的时候，需要的权值会非常多； 2. 对平移、尺度变化敏感（比如数字偏左上角，右下角时即识别失败）； 3. 图片在相邻区域是相关的，而这种网络只是一股脑把所有像素扔进去，没有考虑图片相关性。深度学习（DL）最早的DL：前馈神经网络 feedforward (acyclic) NNs (FNNs) 和周期神经网络 recurrent (cyclic) NNs (RNNs) ；目前应用较普遍的是深度置信网络(deep belief network ,DBN)和卷积神经网络（CNN），DBN网络可以看作是由多个受限玻尔兹曼机叠加而成，CNN通过local receptive fields（感受野），shared weights（共享权值），subsampling（下采样）概念来解决BP网络的三个问题。深度学习（DL）手写字体识别由手写字体组成图像样本经典数据库：mnist，共60000训练样本，10000个预测样本；训练样本维度：28*28*60000 训练标签维度：10*60000 图例： CNN经典程序下载:/rasmusbergpalm/DeepLearnToolbox 语音识别参考：《基于深度学习的语音识别应用研究_张建华》该文献通过深度神经网络提取语音特征的方法、深度神经网络提取声韵母属性的方法、深度学习搭建声学模型的方法对比；一般的语音识别多提取每帧长25ms、帧移10ms的语音对应的MFCC特征,该文提取使用fBank特征。 CNN CNN结构图： CNN 在Toolbox的实现中，C1共有6个卷积核，则卷积结果6个特征map;卷积层的一个map与上层的所有map都关联，如上图的S2和C3，即C3共有6*12个卷积核， C1有156个可训练参数（每个滤波器5*5=25个 unit 参数和一个 bias 参数，一共6个滤波器，共(5*5+1)*6=156个参数）。最后一层将4*4的map平铺成一条特征数组，用于训练。输入图像：28*28 卷积层：均为5*5 采样核大小：均为2*2。卷积层卷积层的每一个特征map是不同的卷积核在前一层所有map上作卷积并将对应元素累加后加一个偏置，再求sigmod得到的。假设上一层的map大小是n*n、卷积核的大小是k*k，则该层的map大小是(n-k+1)*(n-k+1)，比如上图的24*24的map大小24=（28-5+1）。参见网址：/lu597203933/article/details采样层是对上一层map的一个采样处理，相当于对上一层map的相邻小区域进行聚合统计，区域大小为scale*scale，有些是取小区域的最大值，而ToolBox里面的实现是采用2*2小区域的均值。CNN ToolBox里面也是用卷积来实现采样的，卷积核是2*2，每个元素都是1/4。池化层反向传输反向传输过程是CNN最复杂的地方，虽然从宏观上来看基本思想跟BP一样，都是通过最小化残差来调整权重和偏置，但CNN的网络结构并不像BP那样单一，对不同的结构处理方式不一样，而且因为权重共享，使得计算残差变得很困难。计算公式如下：谢谢