基于YOLO的多类别多目标检测算法改进.pdfVIP

基于YOLO的多类别多目标检测算法改进.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

软件开发

基于YOLO的多类别多目标检测算法改进

1112

马帅,田国富,张文鹏,周淑文

(1.沈阳工业大学,辽宁沈阳,110027;2.东北大学,辽宁沈阳,110167)

摘要:针对智能驾驶感知算法检测效果不佳、模型过大等问题,在YOLOV3算法上进行改进,首先选取了一种更加高效且更符合实际需求

的激活函数——GELU激活函数,构建的DBG模块不仅在负区间对数值处理更加得当,且在一定程度上抑制过拟合倾向;考虑到目标语义

信息和位置信息分布不均对检测效果的影响,提出‘双塔结构’将两种信息进一步融合,并在中路增加DBG模块对融合后的信息强化提

取,进一步提升目标的识别率;本着精度不变的条件下模型越小越好的原则对模型进行层级剪枝优化,提高了智能驾驶感知算法的检测

速度且降低了模型大小。实验首先通过K-Means聚类算法生成先验框,最后在BDD100K数据集上进行测试,实验结果相比YOLOv3算法,

Bus检测精度提升了5%,Bike和Rider检测精度提升了3%;改进前后mAP提高了2.375%;且FPS提升7%;模型大小由240882KB减少到

234134KB,具有更好的实用性。

关键词:智能驾驶;信息融合;DBG模块;YOLO;K-Means

0引言1YOLOV3网络结构

智能车辆的技术可分为四个层面:环境感知、行为决YOLOV3的检测过程细分可以分两步:首先确定检测

策、路径规划和运动控制,环境感知是获取外部信息的唯一目标的位置,再对被检测目标进行分类。网络接收到图像数

渠道。随着计算机硬件资源和卷积算法的不断突破,基于据先将其宽高尺寸变为416×416,经过一系列的卷积操作、

CNN(卷积神经网络)的目标检测算法也得到质的提升,残差结构及上采样处理,最后输出目标物体位置、类别以及

并且在精度和性能方面取得了显著成果[1]。基于CNN的目置信度。不同于YOLOV2的检测策略,YOLOV3具有三个

标检测算法目前主要分为Two-Stages(二阶段)和One-不同尺度上的检测,而YOLOV2只有一个检测头(Detection

Stage(一阶段)两种[2],两阶段目标检测算法主要有R-CNN、Head),不同的尺度特征包含丰富的语义信息。YOLOV3

SPP-Net、FastR-CNN系列和MaskR-CNN等;单阶段目网络结构图如图1所示。

标检测算法主要有SDD算法和YOLO系列算法。智能驾驶当输入尺寸为416×416时,32倍/16倍/8倍下采样

感知应达到实时识别的要求,所以只能采用一阶段算法。智后三个检测头的大小分别为13×13、26×26和52×52。

能驾驶环境感知现如今分为两个派别:多传感器信息数据融YOLOV3仍使用K-Means聚类法生成AnchorBox(先验框)。

合和视觉感知,基于视觉的环境感知成本相对来说要低得简单来说,AnchorBoxes就是对预测的对象范围进行约束,

多。本文的自动驾驶目标检测仍选用YOLOV3作为视觉感对于每一个网格都生设置3个AnchorBoxes,由于在三个

知算法基础框架,针对YOLOV3检测器识别精度不高,且不同尺度FeatureMap上做预测,所以一个位置共有9个

检测速度和模型大小均有一定的提升空间的问题,提出了一AnchorBoxes。该算法的缺点是对于小而密集目标检测效

些可行方案。果不佳,且检测速度和模型大小均有进一步的优化空间。

图1YOLOV3网络结构图

68|电子制作2023年6月

您可能关注的文档

文档评论(0)

经典文库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档