深度学习PPT资料.pptx

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
深度学习PPT资料

深度学习 ----许洛 深度学习(DL) 深度学习(DL) 60、70年代,神经网络(NNs)最早可以追溯的时期,构建出连续非线性层的神经元模型; 随后,建立带有梯度下降的BP模型,1981年首次NN得到应用; 80年代末,基于BP训练的深度神经网络(Deep NNs)依然很难实现,90年代开始成为研究主体; 1991, 通过无导学习的深度学习(Deep Learning,DL)在实际中可以运用; ?2009,有导师学习的DL在大部分国际模式识别竞赛中领先于其他机器学习方法,并且第一个实现超人视觉模式识别,从此赢得广泛关注。 文献参考:Deep learning in neural networks: An overview 深度学习(DL) BP 神经网络(BPNNs)网络存在的主要问题: 1. 一般要得到较好的训练效果,隐层数目不能太少,当图片大的时候,需要的权值会非常多; 2. 对平移、尺度变化敏感(比如数字偏左上角,右下角时即识别失败); 3. 图片在相邻区域是相关的,而这种网络只是一股脑把所有像素扔进去,没有考虑图片相关性。 深度学习(DL) 最早的DL:前馈神经网络 feedforward (acyclic) NNs (FNNs) 和周期神经网络 recurrent (cyclic) NNs (RNNs) ; 目前应用较普遍的是深度置信网络(deep belief network ,DBN)和卷积神经网络(CNN),DBN网络可以看作是由多个受限 玻 尔 兹 曼 机叠加而成,CNN通过local receptive fields(感受野),shared weights(共享权值),subsampling(下采样)概念来解决BP网络的三个问题。 深度学习(DL) 手写字体识别 由手写字体组成图像样本 经典数据库:mnist,共60000训练样本,10000个预测样本; 训练样本维度:28*28*60000 训练标签维度:10*60000 图例: CNN经典程序下载:/rasmusbergpalm/DeepLearnToolbox 语音识别 参考:《基于深度学习的语音识别应用研究_张建华》 该文献通过深度神经网络提取语音特征的方法、深度神经网络提取声韵母属性的方法、深度学习搭建声学模型的方法对比; 一般的语音识别多提取每帧长25ms、帧移10ms的语音对应的MFCC特征,该文提取使用fBank特征。 CNN CNN结构图: CNN 在Toolbox的实现中,C1共有6个卷积核,则卷积结果6个特征map;卷积层的一个map与上层的所有map都关联,如上图的S2和C3,即C3共有6*12个卷积核, C1有156个可训练参数(每个滤波器5*5=25个 unit 参数和一个 bias 参数,一共6个滤波器,共(5*5+1)*6=156个参数)。 最后一层将4*4的map平铺成一条特征数组,用于训练。 输入图像:28*28 卷积层: 均为5*5 采样核大小:均为2*2。 卷积层 卷积层的每一个特征map是不同的卷积核在前一层所有map上作卷积并将对应元素累加后加一个偏置,再求sigmod得到的。 假设上一层的map大小是n*n、卷积核的大小是k*k,则该层的map大小是(n-k+1)*(n-k+1),比如上图的24*24的map大小24=(28-5+1)。 参见网址:/lu597203933/article/details采样层是对上一层map的一个采样处理,相当于对上一层map的相邻小区域进行聚合统计,区域大小为scale*scale,有些是取小区域的最大值,而ToolBox里面的实现是采用2*2小区域的均值。CNN ToolBox里面也是用卷积来实现采样的,卷积核是2*2,每个元素都是1/4。 池化层 反向传输 反向传输过程是CNN最复杂的地方,虽然从宏观上来看基本思想跟BP一样,都是通过最小化残差来调整权重和偏置,但CNN的网络结构并不像BP那样单一,对不同的结构处理方式不一样,而且因为权重共享,使得计算残差变得很困难。计算公式如下: 谢谢

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档