- 1、本文档共67页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图 3-20 固定阶场景目标识别模型学习出的部分分布 36
图 3-21 固定阶图模型下基于 TDP 的多目标识别 36
图 3-22 基于部分和 TDP 的场景目标表达 37
图 3-23 基于 TDP 的“中国式餐馆”模型[28] 38
图 3-24 非固定阶场景目标识别模型学习出的部分分布 40
图 3-25 非固定阶图模型下基于 TDP 的多目标识别 41
图 4-1 词汇概率分布示例 43
图 4-2 不同场景类别的相似度矩阵 43
图 4-3 融入全局上下文信息的场景分析图模型 43
图 4-4 (a)目标类别的分布情况;(b)视觉词汇分布情况 44
图 4-5 图像所属场景类别概率示意 45
图 4-6 场景共生矩阵示例 45
图 4-7 所有类别场景下目标类别间的共生矩阵 46
图 4-8 融入局部上下文信息的场景分析图模型 46
图 4-9 局部上下文知识解决目标视觉歧义问题的实例 47
图 4-10 HDP 下融入全局和局部上下文信息的场景分析图模型 47
图 4-11 融入知识的场景分析过程 48
图 4-12 场景分析指导目标识别 49
图 4-13 目标识别反馈作用场景,解决场景视觉歧义问题的实例 50
图 4-14 目标识别结果反馈作用于场景分析 50
独 创 性 声 明
本 人声明 所呈 交的学 位论 文是本 人在 导师指 导下 进行的 研究 工作及 取得 的研究 成果。 据我所知,除了文中特别加以标志和致谢的地方外,论文中不包含其他人已经发表或撰
写 过的研 究成 果 ,也 不 包 含为获 得 合肥 工业大 学
或其 他教育 机构 的学位 或证 书而 使
用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说 明并表示谢意。
学位论文作者签字:朱士蓉 签字日期: 2011 年 04 月 16 日
学位论文版权使用授权书
本学位论文 作者完全了 解 合肥工 业大学
有关保留、使用学位论文的规定,有权
保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅或借阅。本人
授权 合肥工业大学
可以将学位 论文的全部 或部分论文 内容编入有 关数据库进行 检
索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。
(必威体育官网网址的学位论文在解密后适用本授权书)
学位论文者签名:朱士蓉 导师签名:高隽
签字日期: 2011 年 04 月 16 日 签字日期: 2011 年 04 月 16 日 学位论文作者毕业后去向:
工作单位:杭州淘宝 电话:通讯地址:杭州市华星路 99 号 邮编: 310099
PAGE
PAGE 10
第一章 绪 论
1.1 研究背景及意义
真实世界的场景具有复杂、多变等特性,这使得图像分析成为一项颇具挑 战的任务。目标识别和场景分析是图像分析领域的两大核心任务。目标识别和 图像区域的特征描述紧密相关,区域特征分割为目标识别提供了输入数据。根 据认知科学不完全统计,真实世界场景中存在约一万至三万种目标类别描述, 如何区别这些描述,如何体现各种目标的认知特性,是场景中目标识别的研究 关键。由此我们可以归纳出,目标识别的主要问题可归结为以下两个方面:目 标建模和计算。目标建模是指如何去学习 /定义一般多变模式 /目标的统计学 问 题;计算是指根据建模结果处理概率推理的问题。场景分析是一个知识密集型 过程。只有融入这种类似人类知识的计算机才可以认为具有智能的“视觉”。目 标建模和场景解释需要大量的先验知识,因此,仅仅通过计算机的学习,建立 相应类别目标和场景的区分信息是远远不够的。只有在计算机形成有效的数据 表示结构和学习分析策略后,将这些内容转换成类似人类语义知识描述,同时 将前端获取的图像数据信息转换为模型可识别的信息,才能让计算机实现近似 人类视觉感知和分析过程。
在非特定环境、非限定约束条件下,让计算机直接对图像信息进行分析, 准确判断出场景图像中有什么、在哪儿以及目标间的相互关系,是非常困难的 事情。为此,需要借助一种有效的知识表达结构,使目标识别过程融入必须的 先验信息。图模型即是一种有效知识表达系统,它作为图论和概率论的融合, 由概念及概念间的若干关系构成。概念往往用图模型的节点来表示,可以理解 为系统的动作、原因、结果、倾向及趋势等,它反映系统的属性、性能与品质, 如果赋予每个节点很强的语义信息,那么整个图模型的语义信息就很强;概念 间的关系常用图模型中的边来表示,它是有效的表达工具并支持基于先验知识 的自适应行为。在计算机视觉分析中,图模型由语义信息和视觉特征的基本单 元结构化组合构成,具有高效的知识表达存储和概率分
您可能关注的文档
- 基于内容管理平台的寿险公司门户网站设计与实施-软件工程专业论文.docx
- 基于遗传算法的RBF神经网络用于配电网线损计算-电力系统及其自动化专业论文.docx
- 基于深度神经网络的表情识别算法-模式识别与智能系统专业论文.docx
- 基于天然橡胶的硫化促进剂的合成及性能研究-材料科学与工程专业论文.docx
- 基于鱼眼图像的全景漫游模型研究-计算机应用技术专业论文.docx
- 基于可靠性的供电设备检修计划优化-电力系统及其自动化专业论文.docx
- 基于数据流的数据分析的分析-计算机应用技术专业论文.docx
- 基于深度图像的人体运动检测及其步态分析研究-模式识别与智能系统专业论文.docx
- 基于适配体传感器的抗生素残留检测方法研究-食品科学与工程专业论文.docx
- 基于特定领域对象级垂直有哪些信誉好的足球投注网站中的对象抽取问题的研究-计算机系统结构专业论文.docx
文档评论(0)