第2单元-情境2-04YOLOV3模型网络结构.pptx

下载文档

0
0
约5.94千字
约 31页
2024-09-07 发布于江苏
举报
版权申诉
保障服务

第2单元-情境2-04YOLOV3模型网络结构.pptx

1、本文档共31页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

智能感知应用技术实训第二单元基于智能图像感知技术应用场景主讲人：XXXX职称：XXXX

基于AI能力的智能感知技术与应用第二单元基于智能图像感知技术应用场景主讲人：陈小龙职称：讲师

第二单元基于智能图像感知技术应用场景0102情境一基于MTCNN模型实现人脸识别情境二基于YOLOV3模型实现目标检测

情境二基于YOLOV3模型实现目标检景概述知识准备案例讲解总结

知识准备yolov3原理情景二：基于YOLOV3模型实现目标检测1．算法基本思想首先通过特征提取网络对输入特征提取特征，得到特定大小的特征图输出。输入图像分成13×13的gridcell，接着如果真实框中某个object的中心坐标落在某个gridcell中，那么就由该gridcell来预测该object。每个object有固定数量的boundingbox，YOLOv3中有三个boundingbox，使用逻辑回归确定用来预测的回归框。

知识准备yolov3原理情景二：基于YOLOV3模型实现目标检测2．网络结构上图DBL是Yolov3的基本组件。Darknet的卷积层后接BatchNormalization（BN）和LeakyReLU。除最后一层卷积层外，在yolov3中BN和LeakyReLU已经是卷积层不可分离的部分了，共同构成了最小组件。

知识准备yolov3原理情景二：基于YOLOV3模型实现目标检测2．网络结构主干网络中使用了5个resn结构。n代表数字，有res1，res2,…,res8等等，表示这个res_block里含有n个res_unit，这是Yolov3的大组件。从Yolov3开始借鉴了ResNet的残差结构，使用这种结构可以让网络结构更深。对于res_block的解释，可以在上图网络结果的右下角直观看到，其基本组件也是DBL。

知识准备yolov3原理情景二：基于YOLOV3模型实现目标检测2．网络结构在预测支路上有张量拼接（concat）操作。其实现方法是将darknet中间层和中间层后某一层的上采样进行拼接。值得注意的是，张量拼接和Res_unit结构的add的操作是不一样的，张量拼接会扩充张量的维度，而add只是直接相加不会导致张量维度的改变。

知识准备yolov3原理情景二：基于YOLOV3模型实现目标检测2．网络结构Yolo_body一共有252层。23个Res_unit对应23个add层。BN层和LeakyReLU层数量都是72层，在网络结构中的表现为：每一层BN后面都会接一层LeakyReLU。上采样和张量拼接操作各2个，5个零填充对应5个res_block。卷积层一共有75层，其中有72层后面都会接BN和LeakyReLU构成的DBL。三个不同尺度的输出对应三个卷积层，最后的卷积层的卷积核个数是255，针对COCO数据集的80类：3×(80+4+1)=255，3表示一个gridcell包含3个boundingbox，4表示框的4个坐标信息，1表示置信度。

知识准备yolov3原理情景二：基于YOLOV3模型实现目标检测2．网络结构请看网络流程图：

知识准备yolov3原理情景二：基于YOLOV3模型实现目标检测3．输出映射我们看一下YOLO3共进行了多少个预测。对于一个416*416的输入图像，在每个尺度的特征图的每个网格设置3个先验框，总共有13*13*3+26*26*3+52*52*3=10647个预测。每一个预测是一个(4+1+80)=85维向量，这个85维向量包含边框坐标（4个数值），边框置信度（1个数值），对象类别的概率（对于COCO数据集，有80种对象）。

知识准备yolov3原理情景二：基于YOLOV3模型实现目标检测3．输出映射例如：将原图映射到13*13的鸟格上，图中的红色小方框输出信息有哪些呢？会返回3个bbox；每个bbox带有：x,y,w,h,conf,label1概率，lebel2概率，...，label80概率

知识准备yolov3原理情景二：基于YOLOV3模型实现目标检测4．边界框预测Yolov3关于boundingbox的初始尺寸还是采用Yolov2中的k-means聚类的方式来做，这种先验知识对于boundingbox的初始化帮助还是很大的，毕竟过多的boundingbox虽然对于效果来说有保障，但是对于算法速度影响还是比较大的。在COCO数据集上，9个聚类如下表所示，注这里需要说明：特征图越大，感受野越小。对小目标越敏感，所以选用小的anchorbox。特征图越小，感受野越大。对大目标越敏感，所以选用大的anchorbox。

知识准备yolov3原理情景二

您可能关注的文档

文档评论（0）

一笑倾洁 + 关注: 实名认证

内容提供者

PPT课件

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第2单元-情境2-04YOLOV3模型网络结构.pptx