网站大量收购闲置独家精品文档,联系QQ:2885784924

计算机科学与技术毕业论文-基于数字图像处理的物体检测系统设计.doc

计算机科学与技术毕业论文-基于数字图像处理的物体检测系统设计.doc

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

基于数字图像处理的物体检测系统设计

摘要

图像的显著性检测常作为图像识别过程中的预处理步骤出现,他的任务是通过实现算法模拟人类视觉系统以快速定位并提取视觉场景中最具吸引力的物体,通过这样的方式能够充分利用计算资源,提高计算机处理图像的能力,而且排除了背景区域的干扰从而提升后续图像处理算法的准确度。

现阶段多数显著性检测方法利用的是神经网络,通过卷积操作提取图像特征。然而大量的卷积和池化操作,会使图像的底层、细节等特征丢失,造成检测的显著目标不完整,边缘区域模糊的问题。为此,本文提出了多尺度特征融合模型,将卷积操作的特征经过融合结构融入解卷积层各个阶段,并引入了一种新的损失函数SCE,用于锐化图像边界。

该网络模型由特征融合和边缘增强两个主要模块构成。多层特征融合部分采用了高效的密集采样方式挖掘丰富的上下文信息,并通过融合局部特征和学习稠密的多尺度上下文来增强特征的可辨别性。边缘增强部分提出的结构化的交叉熵损失函数考虑了每个像素的一个局部邻域,使相同标签像素点的预测值趋于一致,以更好的分离背景与显著物体,产生边界清晰的检测结果。这两个互补的模块,能够准确捕捉突出目标的准确位置,同时锐化其边缘细节。

本文所提的算法均在显著性检测领域的五个公开数据集上进行测试,并与该领域现有的14种算法进行了对比分析。实验结果证明本文所提出的算法的性能明显优于之前的方法。

关键词:显著性目标检测;特征融合;边缘增强;卷积神经网络

目录TOC\o1-3\u

第一章绪论 1

1.1研究意义及背景 1

1.2显著目标检测的难点 1

1.3本文的研究目的和主要工作 2

1.4本文的组织结构 2

第二章国内外研究现状 5

2.1主要的显著目标检测方法 5

2.1.1基于分类的显著目标检测方法 5

2.1.2基于全卷积神经网络的显著目标检测方法 6

2.1.3基于多层特征融合的显著目标检测方法 6

2.2数据集及评测指标 8

2.2.1数据集介绍 8

2.2.2评测指标 8

第三章基于多层特征融合与边缘增强的显著物体检测算法 11

3.1相关背景与研究动机 11

3.2网络结构 11

3.4特征融合模块 14

3.5损失函数 15

3.6局部平滑 16

第四章实验结果与分析 19

4.1实验设置 19

4.2与现有方法的比较与分析 19

4.3消融性实验 21

结论 23

参考文献 25

基于数字图像处理的物体检测系统设计

第一章绪论

PAGE

PAGE2

PAGE

PAGE1

第一章绪论

1.1研究意义及背景

随着互联网的广泛普及与使用,网络上的数据信息开始呈爆发式增长,如何让计算机对这些文本、语音、图像以及视频等信息进行智能化处理,解决人们的处理能力不足,成为当今研究的重要课题。从这些海量的图像或视频中寻求人类的视觉系统能够完成的自动化任务,这就是计算机视觉研究的领域。计算机视觉是利用计算机技术代替人眼的图像传感器自动获取图像,并用计算机模拟人的判别准则去识别和分析图像,达到理解有用信息的目的。

对于复杂的生物系统来说,在杂乱的视觉世界中快速发现潜在的目标是很重要的。因此人的眼睛在观察周围环境时总是会只关注视觉范围中的重点区域,科学家们将人眼感知周围环境的机制称之为注意力机制。人的注意力通常被视觉上显著的刺激所吸引。视觉显著性是计算机上模拟人类的视觉关注机制。1998年Itti等人通过注意力模型框架计算机视觉实现,建立第一个显著检测物体模型,并且他们把其实验的结果和经过眼动仪采集的数据进行了对比,发现两者的结果具有高度一致性。显著物体检测也随之成为计算机视觉的一个研究分支。

视觉显著性任务REF_Ref12905\r\h[1]分为两个研究领域:注视点预测和显著目标检测。注视点预测任务中利用眼动仪来捕捉人眼在视觉场景中的运动,然后根据离散的注视点构建真值的概率分布图。它通常关注于场景中的一小部分区域,偏向于预测图像中每个像素点吸引人视觉焦点的可能性,不关心图像中物体本身的物体形状。显著性目标检测任务中,将人眼关注的目标标记为显著目标,将未被人关注的区域称为背景区域。而显著性检测任务倾向于分割出图像中的显著物体,将显著区域分割出来进行识别,它会关注到图像中物体的形状轮廓和物体的整体性,通常作为是其他视觉任务的预处理过程,对算法的精度要求更高,和计算机视觉的语义分割任务联系更加紧密。显著性目标检测应用广泛,可用于图像质量评价、物体的识别、视觉跟踪、图像的预处理REF_Ref17030\r\h[2]等,可以直接定位到图像中较为显著的目标,然后只对这

您可能关注的文档

文档评论(0)

lhmibtf + 关注
实名认证
内容提供者

专注成人学历教育服务10余年。

1亿VIP精品文档

相关文档