- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
文献综述报告
题目
基于卷积神经网络的图像分割技术研究综述
学号
班级
姓名
专业
计算机科学与技术
学生所在学院
计算机科学与技术学院
指导教师
实验名称及地点
21b376
目录
TOC\o1-3\h\z\u1前言 1
2主题 1
2.1卷积神经网络 1
2.1.1起源 1
2.1.2概念 1
2.1.3网络结构 2
2.1.4卷积特征提取 2
2.1.5池化 3
2.2图像分割………………………………..4
3总结 7
参考文献…………………7
前言
随着大数据时代的到来,含更多隐含层的深度卷积神经网络(Convolutionalneuralnetworks,
CVVs)具有更复杂的网络结构,与传统机器学习方法相比具有更强大的特征学习和特征表达能力。使用深度学习算法训练的卷积神经网络模型自提出以来在计算机视觉领域的多个大规模识别任务上取得了令人瞩目的成绩。本文首先简要介绍深度学习和卷积神经网络的兴起与发展,概述卷积神经网络的基本模型结构、卷积特征提取和池化操作。然后综述了基于深度学习的卷积神经网络模型在图像分割应用领域中的研究现状和发展趋势,主要从典型的网络结构的构建、训练方法和性能表现3个方面进行介绍。最后对目前研究中存在的一些问题进行简要的总结和讨论,并展望未来发展的新方向。
主题
2.1卷积神经网络
2.1.1起源
20世纪60年代初期,Hubel和Wiesel等通过对猫的大脑视觉皮层系统的研究,提出了感受野的概念,并进一步发现了视觉皮层通路中对于信息的分层处理机制,由此获得了诺贝尔生理学或医学奖。到了80年代中期,Fukushima等基于感受野概念提出的神经认知机,可以看作是卷积神经网络(Convolutionneuralnetworks,CNNs)的第一次实现,也是第一个基于神经元之问的局部连接性和层次结构组织的人工神经网络。神经认知机是将一个视觉模式分解成许多子模式,通过逐层阶梯式相连的特征平面对这些子模式特征进行处理,使得即使在目标对象产生微小畸变的情况卜,模型也具有很好的识别能力。在此之后,研究人员开始尝试使用一种被称作多层感知器的人工神经网络(实际上是只含一层隐含层节点的浅层模型)来代替手工提取特征,并使用简单的随机梯度下降方法来训练该模型,于是进一步提出了用于计算误差梯度的反向传播算法,这一算法随后被证明十分有效。1990年,LeCun等在研究手写数字识别问题时,首先提出了使用梯度反向传播算法训练的卷积神经网络模型,并在
MNIST手写数字数据集上表现出了相对于当时其他方法更好的性能。梯度反向传播算法和卷积神经网络的成功给机器学习领域带来了新的希望,开启了基于统计学习模型的机器学习浪潮,同时也带动了人工神经网络进入到蓬勃发展的新阶段。目前,卷积神经网络已成为当前语音分析和图像识别领域的研究热点,它是第一个真正意义上的成功训练多层神经网络的学习算法模型,对于网络的输入是多维信号时具有更明显的优势。随着深度学习掀起的新的机器学习热潮,卷积神经网络已经应用于语音识别、图像识别和自然语音处理等小同的大规模机器学习问题中。
2.1.2概念
卷积神经网络是一种为了处理二维输入数据而特殊设计的多层人工神经网络,网络中的每层都由多个二维平面组成,而每个平面由多个独立的神经元组成,相邻两层的神经元之问互相连接,而处于同一层的神经元之问没有连接。CNNs受到早期的时延神经网络(Time-delayneuralnetworks,TDNNs)的启发,TDNN通过在时问维度上共享权值来降低网络训练过程中的计算复杂度,适用于处理语音信号和时问序列信号。CNNs采用了权值共享网络结构使之更类似于生物神经网络,同时模型的容量可以通过改变网络的深度和广度来调整,对自然图像也具有很强的假设(统计的平稳性和像素的局部相关性)。因此,与每层具有相当大小的全连接网络相比,CNNs能够有效降低网络模型的学习复杂度,具有更少的网络连接数和权值参数,从而更容易训练。
2.1.3网络结构
一个简单的卷积神经网络模型的结构示意图如图1所示,该网络模型由两个卷积层(C1,C2)和两个子采样层(S1,S2)交替组成。首先,原始输入图像通过与3个可训练的滤波器(或称作卷积核)和可加偏置向量进行卷积运算,在C1层产生3个特征映射图,然后对每个特征映射图的局部区域进行加权平均求和,增加偏置后通过一个非线性激活函数在S1层得到3个新的特征映射图
文档评论(0)