- 1、本文档共52页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
使用卷积网络实现图像分类第四章
01了解卷积神经网络的基本结构02掌握CNN基本原理、熟悉CNN主要应用03能够搭建和训练卷积神经网络模型04解决实际的图像分类问题、对图像数据进行预处理和增强学习目标CONTENTS
01构建和训练卷积神经网络模型,提高实践动手能力02培养良好的编程习惯03提高问题分析和解决问题的能力04培养团队合作和沟通能力素质目标CONTENTS05培养持续学习的意识和能力
搭建CNN模型训练模型实践任务准备数据测试模型
第一节FashionMNIST图像分类任务介绍FashionMNIST是一个常用的图像分类数据集,它由Zalando提供,包含了10个类别的灰度图像,每个类别包含6000张训练图像和1000张测试图像,图像大小为28x28像素。FashionMNIST的任务是将28x28像素的灰度图像分类到10个不同的类别,包括T恤/上衣、裤子、套衫、连衣裙、外套、凉鞋、衬衫、运动鞋、手提包和踝靴。这个任务的挑战在于,所有的图像都是灰度图像,并且类别之间的差异较小,需要通过学习图像中微小的特征来进行分类。任务需求描述
FashionMNIST图像分类任务介绍在全连接层中,相邻层的神经元全部连接在一起,输出的数量可以任意决定。首要的问题是数据的形状被“忽视”了。比如,输入数据是图像时,图像通常是高、长、通道方向上的3维形状。但是,向全连接层输入时,需要将3维数据拉平为1维数据。图像是3维形状,这个形状中应该含有重要的空间信息。比如,空间上邻近的像素为相似的值、RBG的各个通道之间分别有密切的关联性、相距较远的像素之间没有什么关联等,3维形状中可能隐藏有值得提取的本质模式。而卷积层可以保持形状不变。当输入数据是图像时,卷积层会以3维数据的形式接收输入数据,并同样以3维数据的形式输出至下一层。因此,在CNN中,可以(有可能)正确理解图像等具有形状的数据。技术分析
FashionMNIST图像分类任务介绍总结1.全连接前馈网络很难提取这些局部不变特征2.卷积神经网络受到生物学上感受机制而提出的3.神经元的感受野是指视网膜上的特定区域,只有这个区域内的刺激才能够激活该神经。
第二节卷积计算在卷积神经网络中,紧随输入层的通常是一个卷积层(ConvolutionalLayer)。卷积的实现灵感来源于生物学上的感受野(ReceptiveField),后者是人体听觉或视觉等系统中神经说具有的特殊性质——即神经元只对自己可以接受的某些活动范围/条件内的信号产生刺激,例如,听觉系统中各神经元对不同频率声音的反应是有差异的。卷积层定义
卷积运算卷积层进行的处理就是卷积运算。卷积运算相当于图像处理中的“滤波器运算”。在介绍卷积运算时,我们来看一个具体的例子。卷积运算
填充数据在进行卷积层的处理之前,有时要向输入数据的周围填入固定的数据(比如0等),这称为填充(padding),是卷积运算中经常会用到的处理。比如,在输入数据中,对大小为(4,4)的输入数据应用了幅度为1的填充。“幅度为1的填充”是指用幅度为1像素的0填充周围。填充数据
步幅应用滤波器的位置间隔称为步幅(stride)。之前的例子中步幅都是1,如果将步幅设为2,则如图所示,应用滤波器的窗口的间隔变为2个元素。增大步幅后,输出大小会变小。而增大填充后,输出大小会变大。步幅
多维卷积如果原始输入是一维的图片,但是我们可以用多个卷积核分别对其计算,从而得到多个特征输出。如图所示。多维卷积
多维卷积一张图片,通常是彩色的,具有红绿蓝三个通道。我们可以有两个选择来处理: (1)变成灰度的,每个像素只剩下一个值,就可以用二维卷积 (2)对于三个通道,每个通道都使用一个卷积核,分别处理红绿蓝三种颜色的信息。显然第2种方法可以从图中学习到更多的特征,于是出现了三维卷积,即有三个卷积核分别对应书的三个通道,三个子核的尺寸是一样的,比如都是2x2,这样的话,这三个卷积核就是一个3x2x2的立体核,称为过滤器Filter,所以称为三维卷积。
卷积的批处理神经网络的处理中进行了将输入数据打包的批处理。之前的全连接神经网络的实现也对应了批处理,通过批处理,能够实现处理的高效化和学习时对mini-batch的对应。我们希望卷积运算也同样对应批处理。为此,需要将在各层间传递的数据保存为4维数据。具体地讲,就是按(batch_num,channel,height,width)的顺序保存数据。卷积的
您可能关注的文档
- 深度学习案例教程 课件 第2章 PyTorch 深度学习框架.pptx
- 深度学习案例教程 课件 第3章 简单全连接网络的手写数字识别.pptx
- 深度学习案例教程 课件 第5章 目标检测.pptx
- 深度学习案例教程 课件 第6章 文本分类.pptx
- 深度学习案例教程 课件 第7章 文本翻译.pptx
- 深度学习案例教程 课件 第8章 基于深度学习的代码有哪些信誉好的足球投注网站.pptx
- 深度学习案例教程 课件 第9章 语音识别.pptx
- 深度学习案例教程 课件 第1章 深度学习简介.pptx
- 深度学习案例教程 课件全套 钱月钟 第1--9章 深度学习简介--语音识别.pptx
- 计算机组成原理(第6版)课件 第3章 CPU子系统.pptx
最近下载
- 花城版音乐二年级上册-《温暖的家》教案.pdf
- 2024高考英语考点887个核心词汇 .pdf VIP
- 2024年湖南高速铁路职业技术学院单招职业技能测试题库及答案解析.docx VIP
- 武汉市2025届高中毕业生二月调研考试(二调)数学试卷(含答案详解).pdf
- 世行贷款芦山地震灾后重建和减灾项目芦山县子项目环评报告.doc VIP
- 《消防设施操作员(基础知识初级技能)》配套教材课件完整版(文字可修改版).ppt
- 餐饮业经营与管理(第2版)中职PPT完整全套教学课件.pptx
- 美容皮肤科临床诊疗指南诊疗规范2023版.pdf
- 25题高级工程师岗位常见面试问题含HR问题考察点及参考回答.pdf
- 中职对口分类考试语文一轮复习文化常识专题复习资料.doc
文档评论(0)