- 1、本文档共77页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于零样本学习的目标分类方法研究
摘要
在计算机视觉领域,图像分类一贯被认为是一个富有挑战性和重要性的任务。随
着人工智能技术的迅猛发展,图像分类技术已经在多个领域展现出了广泛的应用前景。
然而,传统的监督学习方法在某些情况下也存在局限性,在现实世界中,获取大规模
标记数据集是一项昂贵和耗时的任务,而且有时甚至是不可行的。因此,面对数据稀
缺或新类别出现的情况,传统监督学习方法已经不再适用,基于零样本学习的图像分
类技术应运而生。传统的监督学习方法往往都需要大量已经被标记的数据来训练模型,
然后才能对新的数据进行分类,而零样本学习不需要已经被标记的数据来训练样本,
而是通过利用类别的语义描述或属性信息,使模型能够对以前未见过的类别进行分类。
这在很大程度上扩展了图像分类技术的应用范围,提高了模型对未知类别的泛化能力,
并且减少了对大量标记数据的依赖。本文针对基于零样本学习的目标分类方法展开研
究,主要研究内容如下:
首先,了解了零样本学习问题定义和评价指标等理论基础,对现有零样本学习研
究方法进行了解并分类总结,并通过在几个基准数据集上进行对比试验,分析了现有
方法的优势和劣势,为后续研究打下理论基础
其次,对基于嵌入的零样本学习分类方法展开研究。现有方法虽然引入注意力机
制,但这些方法通常希望能够从单幅图像中学习到有价值的信息,而忽略了属性的局
部信息以及视觉特征的可转移性。为了解决现有方法在属性特征和语义信息相互映射
过程中,由于全局特征干扰,无法发挥出局部属性更大作用的问题,针对该问题,本
文提出了一种基于Transformer的零样本学习分类方法。该方法采用自适应网格化和局
部属性定位,在属性视觉特征与语义特征向量之间建立更加准确的映射关系对网络进
行优化。通过一系列对比和消融实验验证了改进后算法在分类性能上得到了提升。
再次,对基于伪样本生成的零样本学习方法进行研究。考虑到图像的采集方式和
使用场景的不同,一些特殊场景的图像数据量稀疏、标注难度大等特点,上文中方法
对特殊场景下的图像不再适用。针对此类问题,通过生成伪样本,对数据集进行扩充,
将问题转化为监督学习问题。本文选择声呐图像作为研究对象,由于声呐图像具有图
像噪声大、目标模糊、细节特征缺失的特点,本文提出一种基于改进CycleGAN的零样
本学习分类方法。在生成器网络中引入注意力机制等对网络进行优化,用于指导生成
哈尔滨工程大学硕士学位论文
图像的特征,从而使生成得伪样本的质量得到提高,并使最终分类结果性能得到提升。
通过一系列实验表明该方法在零样本声呐图像分类上得到了理想的效果。
最后,对基于大模型微调的零样本学习方法进行研究。现有基于嵌入的方法和基
于生成的方法基本都要求训练集和测试集属于同一领域,这使得这些方法和训练所得
的模型都只能针对特定的领域和数据范围的问题进行分类,所以研究能够适用于跨领
域的通用方法是非常有必要的。本文提出了一种基于大模型ContrastiveLanguage-Image
Pre-Training,简称CLIP进行微调的零样本学习分类方法,通过引入缓存空间网络使用
少量特定领域数据对模型最终结果进行微调,使模型满足解决通用问题的同时,可以
按着需求针对某一特定领域进行微调,进一步提升的模型的应用价值,并通过实验验
证了该方法的有效性。
关键词:图像分类;零样本学习;Transformer;CycleGAN;CLIP
基于零样本学习的目标分类方法研究
ABSTRACT
Intherealmofcomputervision,imageclassificationremainsaformidableandpivotal
challenge.Asartificialintelligenceanddeeplearningcontinuetoadvanceatarapidpace,the
applicationofimageclassificationtechnologyhasproliferatedacrossdiversedomains,
您可能关注的文档
- 基于检测—跟踪框架的舰船多目标跟踪方法研究.pdf
- 基于剪切振动模式的Janus换能器研究.pdf
- 基于渐进损伤模型的复合材料结构疲劳评估研究.pdf
- 基于结构光点云的水下目标三维重建技术研究.pdf
- 基于捷联惯导的舰船升沉测量方法研究.pdf
- 基于介孔二氧化硅载体肿瘤治疗体系的构建及性能研究.pdf
- 基于金字塔注意力和边缘增强的真实图像去噪方法.pdf
- 基于近场测量的正向声场构建技术研究.pdf
- 基于景深模型的水下图像纹理特征增强研究.pdf
- 基于多尺度信息融合的低可探测目标检测算法研究.pdf
- 5月信用策略:信用行情由短及长展开-250514-国盛证券-17页.pdf
- 社会服务行业动态:关注中美经贸会谈及外贸格局变化,五一假期中国澳门博彩收益增长-250512-中信建投-24页.pdf
- 【宏观快评】2025年4月金融数据点评:金融资产端与负债端的五个观察-250515-华创证券-12页.pdf
- 马应龙(600993)深度报告:深耕肛肠药品老字号,湿厕纸延伸带来新动力-250515-国海证券-51页.pdf
- 权益基金月度观察(2025/04):投资策略分布收敛,整体欠配金融地产-250514-华福证券-16页.pdf
- 毛戈平(1318.HK)深度报告:美妆先导,光蕴无界,熠熠生辉-250515-国海证券-43页.pdf
- 机械设备行业深度报告-灵巧手传感器:重塑人机边界,关注电子皮肤应用-250514-东北证券-41页.pdf
- 医药行业原料药2024及2025Q1业绩综述:保持韧性、优选弹性-250510-浙商证券-19页.pdf
- 关税“压力测试”系列之七:贸易冲突的“终局”?-250511-申万宏源-10页.pdf
- 家电行业月度报告:空调5月内销排产乐观,出口端中美关税会谈落地-250515-山西证券-11页.pdf
最近下载
- 智慧健康养老服务与管理专业《老年常见病的预防与照顾》课程标准.docx VIP
- 2024年广东省江门市小升初数学试卷附答案解析.docx
- 高中数学解三角形解答题专项练习(含答案).doc
- DB43T 433-2009 水生动物检疫检验实验室建设规范.pdf
- 人工智能大模型在医疗健康领域应用的研究.docx VIP
- azbil阿自倍尔操作手册用户使用说明书100 系列 智能阀门定位器 AVP100,102 型.pdf
- 永磁同步电动机能效限定值及能效等级 GB 30253-2013.pdf
- 2024年江苏省苏州园区初三二模物理试题及答案.pdf VIP
- 标准图集-22G813 钢筋混凝土灌注桩图集.pdf
- 核心素养目标下初中《道德与法治》课中学生责任意识的培育研究.docx VIP
文档评论(0)