- 1、本文档共56页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
目录
摘要I
ABSTRACTIII
1绪论1
1.1研究背景与意义1
1.2国内外研究现状2
1.3研究内容5
1.4本文组织结构6
1.5本章小结7
2Logo检测相关理论概述8
2.1深度学习卷积神经网络8
2.2目标检测算法10
2.2.1传统目标检测算法10
2.2.2基于深度学习目标检测算法10
2.3目标检测相关技术12
2.3.1特征融合机制12
2.3.2视觉注意力机制13
2.4本章小结14
3基于解耦的跨层双向引导融合网络的多尺度Logo检测研究15
3.1引言15
3.2DCFNet检测方法16
3.2.1引导聚合和分布特征金字塔16
3.2.2解耦分支模块20
3.2.3损失函数20
3.3实验结果及分析20
3.3.1实验设置和评价指标20
3.3.2实验细节21
3.3.3对比实验21
3.3.4消融实验25
3.3.5可视化结果26
3.4本章小结27
4基于多阶段渐进细化和RoI上下文增强网络的小Logo检测研究28
4.1引言28
4.2MPRRCENet检测方法29
4.2.1多阶段渐进细化模块30
4.2.2RoI上下文增强模块31
4.2.3损失函数32
4.3实验结果及分析32
4.3.1实验设置32
4.3.2对比实验33
4.3.3消融实验37
4.3.4可视化分析38
4.4本章小结38
5总结和展望40
5.1本文工作总结40
5.2未来工作展望41
参考文献42
攻读硕士学位期间论文发表及科研情况49
致谢50
摘要
Logo是一种视觉化的信息表达方式,对特定信息具有形象化的视觉传递效果。随着时
代的不断发展,越来越多的企业、组织、研究机构等拥有代表自身内涵和形象的Logo,Logo
的多样性日益明显。Logo检测作为目标检测的重要组成部分,在现实中拥有广泛的应用前
景,例如知识产权保护、Logo版权追踪、智能交通、商业广告推荐、准确识别可信品牌、
保护消费者权益等。在现实应用场景中,Logo检测可能面临着多尺度、大长宽比、小目标、
低分辨率、扭曲和变形、复杂背景以及数据的长尾分布等问题。由于Logo的尺度变化大
导致不同尺度Logo的检测精度差异明显,Logo的多尺度检测是Logo检测的难点,而小
尺度Logo检测是多尺度Logo检测中的难点。深度学习技术近年来发展迅速,在目标检测
领域中取得了显著的进展,本文对基于深度学习的通用目标检测算法做相应的改进,针对
Logo检测中的难点,设计出性能更加优秀的Logo检测算法。本文工作主要包括以下内容:
(1)针对Logo检测中的多尺度问题,提出一种解耦的跨层融合网络模型。首先使用
跨层连接和双向引导的方式在相邻层和非相邻层促进高层语义特征和低层细节信息之间
的融合和交互,然后分两个阶段采用特征平均和再增强策略并以两条信息流动路径来增强
特征之间的交互,增强特征表示。此外,将分类和边界框回归分支进行简单的分离,避免
分支间的干扰,使分类分支更多地关注Logo
文档评论(0)