第5章信息检索的发展概要.ppt

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5章信息检索的发展概要

第五章 信息检索的发展 本章目录 第一节 多媒体信息检索 5. 1.1 相关概念 (一)媒体的含义 “媒体”一词的含义很多,但在计算机领域中主要有两层含义:一是指信息的物理载体,如磁盘、磁带、光盘等;另一是指信息的表现或传播形式,如声音、文字、图像、动画等。 根据国际电信联盟(ITU:International Telecommunication Union)电信标准部推出的ITU-TI.374建议的定义,可以将媒体划分为如下五类: (1)感觉媒体(2)表示媒体(3)表现媒体 (4)存储媒体(5)传输媒体 5.1.1相关概念 (二)多媒体的含义 在人们的日常谈论中,多媒体的“媒体”常常泛指“感觉媒体”,但多媒体技术所处理的“媒体”主要是指“表示媒体”,而“多”则表示信息表示媒体的多样化。 现在的多媒体技术往往与计算机联系在一起,是指利用计算机技术把各种信息媒体综合一体化,使它们建立起逻辑联系,并进行加工处理的技术。 所谓加工处理主要是指对这些媒体的录入、对信息进行压缩和解压缩、存储、显示、传输等。 多媒体不是“混媒体”。尽管包含的媒体元素很多,但并非机械地将他们拼凑在一起。 5. 1.1 相关概念 多媒体技术的研究内容包括: 多媒体数据处理技术,如多媒体数据模型、多媒体数据压缩、多媒体数据存储与检索技术等; 多媒体数据传输技术,如多媒体网络技术、多媒体视频点播技术等; 多媒体专用设备技术,如多媒体专用芯片技术、多媒体专用输入/输出技术等。 5. 1.1 相关概念 (三)基于文本的多媒体信息检索 基于文本的多媒体信息检索方法(Text-Based Retrieval,简称TBR):针对多媒体的物理及内容特征,抽取出关键词进行著录或标引,建立类似于文本文献信息检索系统的索引数据库。常用的抽取关键词的字段有文件名或目录名、多媒体标题、多媒体周围文本信息或解说文字等。 5. 1.1 相关概念 基于文本的多媒体信息检索方法的主要优点是技术简单,标引和检索方便。它的实质就是文本检索,只是检索结果和输出形式不同而已,因此它的应用与实施方式简单,实现成本也比较低。 局限性: 首先,它不能真正反映信息的内容。这种检索采用文本来表达多媒体的内容,检索对象的不一致决定了在这种信息传递过程中必定会有大量信息的丢失,这样就不可能完全反映信息的内容; 其次,多媒体信息是一种抽象程度很大、随意性很强的信息,缺乏一般意义上的规范性,同样的信息不同的人会有不同的理解,这样便会使得在用文字描述多媒体信息时,不可能做出一个非常准确而完整的描述。 5. 1.1 相关概念 (四)基于内容的多媒体信息检索 基于内容检索(Content-Based Retrieval,简称CBR),就是从媒体数据中提取出特定的信息线索,然后根据这些线索从大量存储在数据库中的媒体中进行查找,检索出具有相似特征的媒体数据出来。 特点: (1)直接从媒体内容中提取特征线索。 (2)基于内容的检索是一种近似匹配,与传统信息检索的精确匹配方法有明显不同。 (3)特征提取和索引建立可由计算机自动实现,避免了人工描述的主观性,也大大减少了工作量。 (4)整个过程是一个逐步筛选和不断求精的过程。 基于内容的多媒体信息检索的流程和指标 5.1.2 基于内容的图像信息检索 图像的内容特征 (1)颜色特征 颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。 常用的颜色特征提取方法: 1)颜色直方图:是在许多图像检索系统中被广泛采用的颜色特征。它所描述的是不同色彩在整幅图像中所占的比例,而并不关心每种色彩所处的空间位置,即无法描述图像中的对象或物体。 2)颜色对特征 3)主色调特征 图像的内容特征(续) (1)颜色特征 其他方法:颜色集、颜色矩 、颜色聚合向量 、颜色相关图 (2)纹理特征 纹理:局部不规则而宏观有规律 图像的内容特征(续) (2)纹理特征 1)纹理特征分析:统计方法与结构方法 2)纹理特征描述:粗糙度、方向性、对比度 (3)形状特征 形状特征有两类表示方法,一类是轮廓特征,另一类是区域特征。图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。 支持图像示例检索 几种典型的形状特征描述方法:边界特征法 、傅里叶形状描述符法 、几何参数法等 /wiki/List_of_CBIR_Engines 5.1.3 基于内容的音频信息检索 所谓基于音频内容的特征处理方法,就是针对音频信息的物理样本、基本属性等进行分析处理,通过数学与统计学方法来获得音频信息物理、听觉、语义等不同层次(或级别)上的特征,并揭示特征之间的相互关系。 下面就介绍几个通过短时处理技术得到的比较常用而且重要的特征: (1)音调:声音频率的高低叫做音调 ,表示人的

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档