2024《基于VGG模型的照片评分机制分析综述》2900字.docxVIP

2024《基于VGG模型的照片评分机制分析综述》2900字.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于VGG模型的照片评分机制分析综述

目录

TOC\o1-2\h\u13473基于VGG模型的照片评分机制分析综述 1

296541.1PyTorch框架 1

194971.2VGG模型 1

133921.2.1VGG模型特点 2

203931.2.2VGG模型结构 2

196141.2.3VGG模型优点 4

187971.3基于VGG的图片分类机制 4

56041.1.1图像预处理 4

199721.1.2图片分类机制 5

1.1PyTorch框架

Torch作为一个经典的能够处理多维矩阵数据的张量(tensor)库,广泛应用于机器学习领域。但Torch语言采用Lua,国内用户不够熟悉,导致其在国内属于小众化,用户使用时相较于支持Python的Tensorflow来说不方便。

PyTorch作为由Facebook开源的神经网络基础框架,是torch的python版本,专门针对GPU加速的深度神经网络(DNN)编程,同时还能支持动态神经网络[12]。PyTorch追求最少的封装设计,在结构上尽量避免重复;遵循从tensor到variable(autograd)最后nn.Module三个由低到高的抽象层次,分别代表高维数组(张量)、自动求导(变量)和神经网络(层/模块),三个抽象层次之间联系紧密,可以同时修改和操作;PyTorch的灵活性高,但不以速度为代价,在许多评测中,相比TensorFlow和Keras等框架PyTorch的速度表现都更加优越;PyTorch是所有的框架中面向对象设计最优雅简洁的一个,其设计最符合人们的思维,它使用户尽可能地专注于实现自己的想法,用户操作过程中所思即所得,不需要考虑太多关于框架本身的束缚。

1.2VGG模型

VGGNet是2014年由牛津大学计算机视觉研究组(VisualGeometryGroup)和GoogleDeepMind公司的研究员一起研发出的的深度卷积神经网络,其主要研究了卷积神经网络的结构深度与其模型性能之间的关系。整体模型架构非常简洁,通过反复堆叠3*3的小型卷积核和2*2的最大池化层,成功地构筑了不同网络深度的卷积神经网络,证明了在一定程度上增加网络的深度能够影响网络最终的应用性能。与之前state-of-the-art的网络结构相比,VGGNet的错误率显著下降,获得了ILSVRC2014比赛分类项目的第2名和定位项目的第1名。同时由于VGGNet拓展性强,使其迁移到其他图片数据上的泛化性非常好,到目前为止,VGGNet依然经常被用来提取图像特征。因其官方网站上成功开源了VGGNet训练后的基础模型参数,提供了非常好的初始化权重,这些参数可用来在特定的图像分类任务上进行再次训练,因此被广泛应用于在卷积神经网络迁移学习中。

1.2.1VGG模型特点

1.结构简洁:整个卷积层结构只有3*3的卷积核,连续的卷积层后使用池化层隔开;

2.小卷积核和连续卷积层:连续的3*3卷积核增大感受野,减少参数量;

1.小池化核:相比AlexNet使用3*3大小的池化核,VGG则全部采用2*2大小的池化核;

4.通道数更多使特征图更宽:通道数的增加,可以提取出更多的有效信息;

5.层数更深:使用连续的小型卷积核代替大的卷积核,使网络结构深度更深,对边缘进行填充避免因卷积计算导致图像尺寸降低;

6.全连接转卷积:在网络测试阶段将训练阶段的三个全连接替换为三个卷积,将训练时的各个参数进行测试重用,使得测试得到的全卷积网络不受全连接限制,可以接收任意维度的宽或高图像作为待检测数据输入。

1.2.2VGG模型结构

VGG本质上是一个框架,目前共有6种网络配置,层数从浅到深分别为11层、13层、16层和19层。它并不具有固定的卷积层数,而是根据需要调整模块中层级结构数量,即调整卷积模块的卷积层数和卷积核大小,实现网络规模和性能间的平衡。网络共有5个卷积模块,每个卷积模块后面跟一个池化层,最后是3个全连接层,所有隐层的激活单元都采用RELU函数。

VGGNet宏观结构如图所示:

图3-1VGG网络宏观架构

图3-2ConvNet配置

以VGG16模型为例介绍ConvNet配置图[13]:

conv3-64:进行第三层卷积后将维度变成64,同样,conv3-128指的是第三层卷积后维度变成128;

input(224x224RGBimage):输入图片大小为224*244的彩色图像,通道数为3,即224*224*3;

maxpool:最大池化,在vgg16结构中,池化层采用的是2*2的最大池化;

FC-4096:全连接层中有4096个节点,而FC-1000则表示该层的全连接层有100

文档评论(0)

02127123006 + 关注
实名认证
文档贡献者

关注有哪些信誉好的足球投注网站

1亿VIP精品文档

相关文档