图像理解.pptVIP

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图像理解

图像理解理论和方法论 第四章 图像信息表示和特征提取 4.1引言 信息和特征是图像理解最基本的处理和分析对象,是完成目标识别,场景分类以及语义分析推理等任务的先决条件。 图像信息表示的基本形式独立于图像内容本身,他主要表示的是图像的基本信息和以何种数据类型存储于计算机中。(通过一些对应关系,使得知识指导图像理解) 图像特征依赖于图像内容,特征提取旨在获取图像中视觉特征信息,减少视觉特征数据量。提取特征要尽量反映目标重要的本原特性(本原特性是指一些不随提取特征时条件和环境变化的特征)。 图像特征对图像理解的效果有重要的影响 4.2图像信息表示 4.21图像数据结构 选择一个适合的信息表示和存储方式,可以表示具体结构关系,节省存储空间,快速存取数据和执行运算,因此合理的数据结构是视觉数据信息表示的关键。 常用的图像数据结构包括:线性表,金字塔结构,图结构以及复杂循环结构 链码描述 线性表是有序性偏序元素集,而平面曲线链码常用于数据信息的线性表示 通过边界的有哪些信誉好的足球投注网站等算法的处理,所获得的输出最直接的方式是各边界点像素的坐标,也可以用一组被称为链码的代码来表示,这种链码组合的表示既利于有关形状特征的计算,也利于节省存储空间。 金字塔结构 处理和分析多分辨率图像时图像数据存储的一种有效方式。 底层为原图像,每层像素尺寸大小不变,图像尺寸改变,因此,各层有不同分辨率。 图结构 图结构表述了图像中点,线,面之间的更为复杂的连接关系和空间关系。 为了表示和控制可视模型,可以采用RSE结构,即区域,线段和端点组成的图 结构分为3层,分别为区域,线段,和节点。 复杂空间数据结构 通用结构,用于表示任何目标和关系集 4.22知识表示 仅仅依靠输入图像提供的信息还不能完全理解图像中的内容因此还需要将人类的知识引入计算机系统,用于对图像的理解和解释。 人工智能中常用的知识表述方法包括基于规则的产生式表示、框架结构表示、语义网络表示 4.23数据与知识的融合 图像中的数据和人类知识构成了图像理解的信息流,处理和分析这些信息流需要建立两类信息之间的统一对应关系,体现“数据”和“知识”的融合. 保证视觉信息的存储方式和知识信息处理方式的一致连贯性,选择合适的计算机特征表示方法实现人类的知识表示。 在图像理解中,人对图像场景理解所需的知识是以语句概念为基本实体的若干关系下的网络壮结构认知体系。 实体关系则具体包括相似关系,因果关系、位置关系、包含关系等。 相似度 相似度是实体间视觉相似度的度量,既有可能是目标之间,又有可能是场景之间。 任何目标和场景的信息均存储在反应视觉特征的结构单元中。 可采用特征共享编码矩阵表示实体间的相似关系 因果关系,位置关系 因果关系式认知体系中最常见的关系 位置关系主要包括特征线面间和目标实体间的位置关系。 “场景→目标→区域→线段→像素点”逐层认知包含关系。 4.3图像特征提取 图像特征提取是图像理解中从图像获得数据信息并进行相关分析的前提条件和关键环节 图像的特征提取策略1基本特征提取方法 2常用特征提取方法 4.3.1基本图像特征提取 图像特征指的是图像的原始特征或属性,而基本图像特征就是指那些视觉能够直接感受到的自然特征,属于像素级特征,如区域亮度、边缘轮廓、纹理或色彩。 图像特征的提取的结果就是给出某一图像与其他图像相区别的特征。颜色、形状、纹理是场景中目标的基本特征。 4.3.1.1颜色特征 一颜色空间:又叫彩色空间,是用来表示颜色的三个参数所构成的3D空间,是颜色抽象表示和描述的方法. RGB颜色空间:红、绿、蓝三基色构成。空间中的其他颜色都是由着三色线性或非线性构成。 XYZ颜色空间:由虚拟的三种基色构成,能够表示所有的颜色。 HIS颜色空间:由灰度、强度、饱和度构成。 L*a*b颜色空间:由RGB三基色转化而来,其中L是指发光率。 L=0.299R+0.587G+0.114B 颜色统计特性:颜色特征是图像最直观、最明显的特征、一般用直方图描述,除了直方图,还可以用颜色矩、和颜色集表示。 一阶是颜色的均值,二阶是颜色的标准差,三阶是颜色的偏差 4.3.1.2形状特征 形状可看做是目标轮廓,能刻画物体边缘的本质特征。 形状特征表达的一条重要准则是要求对目标的位移、旋转及尺度缩放具有不变性。 形状特征主要包括:全局几何特征和形状域几何特征。 全局几何特征是指周长、面积、长轴、短轴等 小波描绘子 将原始图像分解为一幅低频图和三幅高频图,完成小波一级分解,然后将一级小波分解中的低频图转化为一幅低频图和三幅高频图完成小波二级分解。 4.313纹理特征

文档评论(0)

baoyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档