- 1、本文档共57页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
深度学习在图像识别中的应用
目
录
CONTENTS
2
图像识别概述
1
3
图像识别
图像识别也就是图像的模式识别,是模式识别技术在图像领域中的具体应用,是对输入的图像信息建立图像识别模型,分析并提取图像的特征,然后建立分类器,根据图像的特征进行分类识别的一种技术。
4
图像识别
预处理,指将训练或者测试的图像进行一定的处理,使得它更加清晰或者更加适合算法要求。常见的预处理手段包括去噪处理、图像增强、归一化。
特征提取。
分类器无法识别像素级别的浅层信号,只能识别高层信号
从训练数据中提取“有用的”高层信号(特征)
识别分类,指算法通过一定的训练后,形成一个分类标准,可以将测试集中的待识别图像归为某一类的过程。。
5
图像识别的应用
在军事领域,无人机侦探,导弹精确打击,军事目标锁定,雷达警戒系统等
在公共安全领域,机场安检,恐怖分子搜查,公共交通安全,车牌定位,目标追踪等,
在农业领域,物种识别,产品营养成分分析,农作物病情分析等
在日常生活中,门禁系统的人脸识别、视网膜扫描、指纹扫描等。
6
图像识别的常用方法
贝叶斯分类法
模板匹配法
核方法
集成学习方法
人工神经网络法(ANN)
7
人工神经网络与深度学习
2
8
人脑识别的过程
人脑是通过分级的、多层网络模型来识别
减少数据量,保留物体的有用信息
9
ANN的发展史
1943年,Mcculloch和Pitts提出了神经元的数学模型,奠定基础;
1958年,Rosenblatt 提出了感知机模型,首次把人工神经网络的研究从理论探讨付诸工程实践;
1969年,Minskyh《感知机》指出当前的网络只能应用于简单的线性问题,却不能有效地应用于多层网络,低潮;
1982年,美国物理学家Hopfield博士提出了Hopfield模型理论,他证明了在一定条件下,网络可以达到稳定的状态。在他的影响下,神经网络得以复兴;
80、90年代,提出BP算法、CNN;
2006年,Hinton 提出了一种深度神经网络参数的训练算法,在物体识别、图像分类、语音识别等领域取得了突破性进展,开启了深度学习在学术界和工业界的浪潮。
10
人工神经网络与深度学习
深度学习的概念源于人工神经网络的研究,是机器学习的分支;
机器学习的发展经历了浅层学习和深度学习两次浪潮
浅层学习,通常包含一层或两层的非线性特征变换,可以看成是具有一层隐含层或者没有隐含层的结构。大多数传统的机器学习和信号处理技术,都是利用浅层结构的架构。例如高斯混合模型(GMMs)、支持向量机(SVMs)等都是浅层结构。
深度学习,主要指超过三层的神经网络模型。
11
深度学习的现状
深度学习在语音识别、图像识别等领域摧枯拉朽。
12
国际会议、期刊等涌现大量深度学习的文章,CNN被引入很多领域。
知名高科技公司都在深度学习领域加大投入。
深度学习对图像识别的影响
Google Brain项目,用16000个CPU Core的并行计算平台,创建了一个深度神经网络,仅通过YouTube视频学习到“猫”;
2012年Hinton用DNN技术在图像识别方面取得惊人的成功,在著名的ImageNet问题上将错误率从26%降低到了15%,并且输入没有用到其他任何人工特征,仅仅是图像的像素。
13
深度学习
深度学习是一种高效的特征提取方法
深度是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。
深度学习作为机器学习的一个分支,其学习方法可以分为
无监督学习:深度信念网(Deep Belief Network,DBN)
监督学习:卷积神经网络(Convolutional Neural Nerwork, CNN)
14
卷积神经网络(CNN)
3
15
CNN的由来
卷积神经网络(CNN)是人工神经网络的一种,是多层感知机(MLP)的一个变种模型,它是从生物学概念中演化而来的。
Hubel和Wiesel早期对猫的视觉皮层的研究中得知在视觉皮层存在一种细胞的复杂分布,这些细胞对于外界的输入局部是很敏感的,它们被称为“感受野”(细胞),它们以某种方法来覆盖整个视觉域。这些细胞就像一些滤波器一样,够更好地挖掘出自然图像中的目标的空间关系信息。
视觉皮层存在两类相关的细胞,S细胞(Simple Cell)和C(Complex Cell)细胞。S细胞在自身的感受野内最大限度地对图像中类似边缘模式的刺激做出响应,而C细胞具有更大的感受野,它可以对图像中产生刺激的模式的空间位置进行精准地定位。
16
CNN概述
卷积神经网络已成为当前语音分析和图像识别领域的研究热点。
80年代末,Yann LeCun就作为贝尔实验室的研究员提出了卷积网络技术,并展示如何使用它来大幅度提高手写识别能力。
目前来看
文档评论(0)