- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
?
?
基于keras的卷积神经网络的图像分类算法研究
?
?
杨梦卓郭梦洁方亮
摘要:当前卷积神经网络应用于图像识别已成为研究的热点之一。相比于Tensorflow,Keras使用最少的程序代码、花费最少的时间就可以建立深度学习模型,进行训练、评估准确率,并进行预测。在Python的环境下输入CIFAR-10数据集,对图片进行归一化、数据增强等预处理后,利用Keras构造改进的VGG16卷积神经网络结构对CIFAR-10图像数据集进行建模和预测,最后通过比较不同的BatchSize来比较不同模型的准确率和损失,实验结果表明当BatchSize为128,CIFAR-10数据集识别正确率达到89%,明显高于其他方法。
关键词:VGG16;卷积神经网络;深度学习;Keras;图像识别
:TP751?:A
1keras简介
Keras是一个开放源码的高级深度学习程序库,它的设计参考了Torch,用Python语言编写,支持GPU和CPU,是一个高度模块化的神经网络库。目前Keras提供了两种后端引擎:Theano与TensorFlow,在二者之上,Keras提供了可以让用户更专注于模型设计并更快进行模型实验的API。这些API以模块的形式封装了来自Tensorflow和Theano的诸多小的组件,所以使用这两者能够搭建的网络也可以通过Keras进行搭建,并且基本上没有性能损失。使用Keras框架最大的好处是在搭建新的网络结构时能够能够节约更多的时间。
2相关算法
2.1卷积神经网络(CNN)
卷积神经网络(ConvolutionalNeuralNetwork,CNN或ConvNet)属于前馈神经网络,一般是通过卷积层、汇聚层和全连接层交叉堆叠而成,基于反向传播算法进行训练,最早主要用来处理图像信息。当使用全连接前馈神经网络训练图像时,会产生参数太多、很难提取局部不变特征的问题。而卷积神经网络有局部连接,权重共享和等变表示三个结构上的特点。因此这些特性使得卷积神经网络具有一定程度上的平移、缩放和旋转不变性。
2.2VGGNet卷积网络模型
VGGNet模型对卷积神经网络的深度与其性能之间的关系进行了探索,网络的结构非常简洁,它的整个网络中全部使用了大小相同的卷积核(3×3)和最大池化核(2×2)。通过重复堆叠的方式,使用这些卷积层和最大池化层成功的搭建了11~19层深的卷积神经网络。根据网络深度的不同以及是否使用LRN,VGGNet可以分为A~E6个级别。如表1所示为VGGNet各级别的网络结构表。
由表1可以看出,VGGNet拥有5段卷积,每一段卷积内都有一定数量的卷积层(或一个或四个),所以是5阶段卷积特征提取。每一段卷积之后都有一个max-pool层,这些最大池化层被用来缩小图片的尺寸。并且同一段内的卷积层拥有相同的卷积核数,之后每增加一段,该段内卷积层的卷积核就增长一倍。
3卷积神经网在CIFAR-10数据集上的应用
3.1CIFAR-10数据集
CIFAR-10是一个图像数据集,是用于普通物体识别的小型数据集,最初是由Alex及其团队收集而来。CIFAR-10中有60000张彩色图片,每张图片的大小是32x32,60000张图片中有50000张用于训练,10000张图片用于测试,分别有五个训练块、一个测试块。图片的内容标签分为10类,每张图片的标签唯一,每一类图片的个数都是6000张。
3.2改进的VGG16模型的结构设计
本文采用的模型是在VGG16模型基础上做的改进,使用固定尺寸的小卷积核(3×3),两层卷积层搭配一层池化层,使用VGG16的前三个卷积池化结构:以2的幂次递增卷积核数量(64,128,256),全连接层没有采用VGG16庞大的三层结构,避免运算量过大,卷积层输出直接上10分类的SoftmaxClassifier,权重初始化采用HeNormal,而没有采用Xavier,并且加入Drop层,防止模型过度拟合。
3.3模型訓练过程
3.3.1图像预处理
图像预处理阶段分三步进行,第1阶段合并全部50000张训练图片及其标签将像素灰度值归一化;第2阶段对数据集进行图像增强;第3阶段将标签进行One-Hot编码,以达到使用Softmax进行预测的目的;第四阶段导出预处理后的训练数据。
3.3.2利用Keras建立模型
导入Keras的相关模块,基于Keras构造上述模型,summary()查看的模型的完整结构如图1所示。
第一段卷积网络是由2个卷积层和1个最大池化层构成。这两个卷积层的卷积核的大小都是3×3,同时卷积核数量也均为64,步长为1×1。第一个卷积层的输入input的尺寸为32×32×3,输出尺寸为32×32×64;而第二个卷
文档评论(0)