- 1、本文档共85页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第6章计算机视觉应用——2D目标检测
目录CONTENTS6.1图像目标检测简介6.2两阶段式2D目标检测算法FasterR-CNN6.3单阶段式2D目标检测网络YOLOv56.4目标检测算法评价指标
第6章计算机视觉应用———2D目标检测在计算机视觉领域,目标检测(objectdetection)是一项关键任务,旨在识别图像或视频中存在的物体,并确定它们的位置及边界框。目标检测可分为2D目标检测和3D目标检测两大类,使用场景分别是在图像平面和三维空间中定位物体。2D目标检测主要在静态图像中检测和定位物体,这一任务涵盖了各种应用领域,如自动驾驶、视频监控、医学图像分析等。2D目标检测方法通过边界框精确定位物体,并为每个检测到的物体分配一个类别标签。本章将聚焦2D目标检测,深入研究其算法和技术,介绍一系列经典和先进的2D目标检测方法。小知识目标检测是在图像中找到并定位感兴趣物体的过程,常用的算法有FasterR-CNN、YOLO等。
图像目标检测简介6.1
目标检测是计算机视觉的一个非常重要的分支,广泛应用于各个领域。目标检测的任务是识别图像中所有感兴趣的目标(物体),确定目标的类别、位置和大小。由于各类物体的外观、形状和姿态各有不同,加上光照、噪声和遮挡等环境因素的干扰,目标检测一直是计算机视觉领域具有挑战性的问题。因此,目标检测需要解决的核心问题是目标位置的随机性、目标大小和目标形状的不同。小知识特征点检测是特征提取的关键步骤,常用的算法有SIFT、SURF等。6.1图像目标检测简介
传统的目标检测算法大多是基于手工特征,由于缺乏有效的图像表示,只能通过设计复杂的特征表示及各种加速技术对有限的计算资源进行充分利用,如模板匹配、HOG和SVM等。近年来,随着人工智能的发展,深度学习技术逐渐成熟,深度学习方法在目标检测领域的研究越来越广泛。深度学习是学习样本数据的内在规律和表示层次,是一种可以直接从数据中学习特征信息的强大方法,它的最终目的是使机器能够像人一样具有分析学习的能力,能够识别文字、图像和声音等数据。6.1图像目标检测简介
基于深度学习的目标检测方法主要分为两阶段式(two-stage)目标检测算法和单阶段式(onestage)目标检测算法两类。前者先由算法生成一系列候选区域框作为样本,然后通过卷积神经网络(CNN)对这些样本进行分类和定位,这种算法也被称为基于区域的方法,如R-CNN、FasterR-CNN和R-FCN等方法;后者则是直接将目标边界问题转换为回归问题,将输入的数据缩放到统一尺寸,并以网格的形式均等划分,模型同时得到目标的位置和分类结果,如SDD、YOLO等方法。两种方法的区别导致其性能的不同,前者的检测准确率和定位准确率更优,而后者的检测速度更快,图6-1所示为两阶段式与单阶段式目标检测算法架构,两阶段式检测网络通过检测层找出目标出现的位置,得到候选区域框,然后通过检测层2(两阶段式目标检测网络独有)对其进行分类,寻找更加精确的位置;单阶段式检测网络则直接通过检测层生成类别概率和位置坐标,得到最终检测结果。6.1图像目标检测简介
6.1图像目标检测简介
两阶段式2D目标检测算法FasterR-CNN6.2
6.2两阶段式2D目标检测算法FasterR-CNN经过R-CNN和FastR-CNN的积淀,RossB.Girshick在2016年提出了新的FasterR-CNN。在结构上,FasterR-CNN已经将特征提取(featureextraction)、候选区域(regionproposal)、边界框回归(boundingboxregression)、分类回归(classification)都整合在了一个网络中,使得综合性能有较大提高,在检测速度方面提高尤为明显。FasterR-CNN结构如图6-2所示。
FasterR-CNN主要分为以下四部分。6.2两阶段式2D目标检测算法FasterR-CNN(1)特征提取部分(convlayers):作为基于卷积神经网络的目标检测网络,FasterR-CNN首先使用一组基础的卷积层+激活函数+池化层(conv+ReLU+pooling)提取特征图(featuremaps)。该特征图被共享用于后续候选区域网络(RegionProposalNetworks,RPN)层和全连接层。(2)候选区域网络部分:RPN用于生成候选区域框。该层通过softmax函数判断先验框内是否包含目标信息,再利用边界框回归(boundingboxregression)修正先验框获得精确的候选区域框。
6.2两阶段式2D目标检测算法FasterR-CNN(3)兴趣域池化(ROIpooli
文档评论(0)