《利用注意力机制提升FasterR-CNN对遮挡行人检测效能研究(论文)16000字》 .pdf

《利用注意力机制提升FasterR-CNN对遮挡行人检测效能研究(论文)16000字》 .pdf

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第1页

利用注意力机制提升FasterR-CNN对遮挡行人检测效能研究

目录

摘要2

第一章前言2

1.1研究背景及意义2

1.2国内外研究现状3

第二章相关理论知识6

2.1WiderPerson彳亍人测数据集6

2.2卷积神经网络8

2.3相关评价参数11

2.3.1精准率、准确率、召回率、交并比11

2.3.2行人测评价指标11

2.4本章小结12

第三章FasterR-CNN算法12

3.1FasterR-CNN算法原理12

3.2FasterR-CNN算法流程15

3.3算法流程中相关结构的理论介绍16

3.3.1主干特征提取网络16

3.3.2RPN网络19

3.3.3ROIPooling层19

3.3.4分类预测和回归预测20

3.4本章小结20

第四章实验设计与结果分析20

4.1实验目的21

4.2实验环境介绍21

4.3实验设计21

4.3.1主干特征提取网络的设计21

4.3.2注意力机制的设计21

4.3.3损失函数的设计22

4.4实验过程23

4.5实验结果与分析24

4.5.1训练过程24

4.5.2预测过程25

4.5.3评估过程2

4.6本章小结28

第五章总结与展望28

5.1研究总结28

5.2期望29

参考文献29

第2页

摘要

行人测技术一直都备受人们关注,这是因为它的价值能够体现在很多日常的领域

当中。近年来深度学习技术的崛起,使得输入进来的数据特征能够被提取得更加完好,

以至于行人测技术的应用领域更为广泛。不过,由于测场景越来越复杂,现有的

测算法并不能很好地满足需求,对密集场景下被遮挡行人的测效果并不是很完美。本

文主要通过比对主干网络、添加注意力机制来实现FasterR-CNN算法的改进。

本次实验中使用resnet50和vggl6作为该算法框架中的主干网络,使用WiderPerson

数据集完成本次实验的训练、预测和评估。本次实验中考虑主干网络是否会对测的结

果产生影响,结果表明主干网络为vggl6时能够更好地去识别被挡住的行人。同时,在

该算法的主干网络中添加注意力机制,添加的地方位于得到特征图的后面。这种做法使

得网络能璃聚焦于输入进来的关键性数据信息,从而提高该算法对于被遮挡行人的识别

精度。结果表明添加注意力机制后,该算法对于被遮挡行人的识别精度有了提升。

关键字:密集场景,行人测,FasterR-CNN

第一章前言

1.1研究背景及意义

对计算机的视觉任务这一概念的阐述是论述行人测的大前提。它简单地说就是一

门关于研究使用某些电子设备去完成人的眼睛功能的科学学科,而这门学科研究的内容

是“某些电子设备是使用什么方法去感受、去观察这个世界的〃。在这类任务中比较重

要的一个就是对目标的测,它会把测目标的识别和分割这两任务组合在一起。

行人测U]技术可以被当成是目标测的一个特别的例子,该技术专门以行人为目

标,它是一种要利用某些电子设备来获取行人在视频帧或单帧图片中的准确位置,并且

会用矩形框标定出视频帧或单帧图片中的行人的位置和大小的视觉任务(陈天羽,成佳

怡,2022)。此外,对于行人测⑵算法的研究也对许多

文档评论(0)

昊天教育 + 关注
实名认证
内容提供者

自由职业者。

1亿VIP精品文档

相关文档