网站大量收购独家精品文档,联系QQ:2885784924

面向信息可视化的多媒体信息特征的向量表示研究.docVIP

面向信息可视化的多媒体信息特征的向量表示研究.doc

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向信息可视化的多媒体信息特征的向量表示研究.doc

面向信息可视化的多媒体信息特征的向量表示研究 第29卷第4期 2010年4月 情报杂志 JOURNAlOFINTELLIGENCE VoI.29No.4 A0r.2010 面向信息可视化的多媒体信息特征的向量表示研究 ResearchonMulti~mediaInformationFeaturesforInformationVisualization 杨峰 (广东商学院广东省电子商务市场应用技术重点实验室广州510320) 摘要特征表示是信息可视化中一个关键环节.多媒体信息的特征表示决定了对其可视化的质量.从可视化的 通用目的出发,总结多媒体常用的特征表示方法,从中选出适合可视化通用框架的特征表示方法. 关键词信息可视化多媒体特征特征表示 中图分类号TP391G354文献标识码A文章编号1002—1965(2010)04—0159—04 0引言1特征表示 信息可视化是一种对信息进行处理的技术,是情 报学较新的研究热点.它利用视觉形式表示信息和信 息之间的复杂关系,有效的可视化界面使得我们能够 迅速高效地与大型数据集进行交互,从而发现隐藏在 信息内部的关系,特征和规律. 这些信息包括各种媒体,BruceW.H.对互联网电 影库中的428440部电影进行处理,得到可视化的结 果帮助观众选择影片,导演选择演员_lj; D.Kutz通过可视化25年的专利信息, 预测市场需求的趋势2j.按照信息的媒 体类型将信息特征表示分为文本的特征 表示,图像的特征表示,图形的特征表 示,音频类信息的特征表示和面向信息 可视化的通用的信息特征表示技术. 对于不同种类的信息,他们的特征 描述方法是不一样的.结构化数据和部 分半结构化数据的特征已经有很好的描 述方法,可视化分析可以直接使用.对 于大量的多媒体信息来说,他们是非结 构化信息.对他们特征表示的质量决定 了对其的结构,规律可视化的质量,多媒 体信息特征的表示是对其可视化的一个 关键.本文首先总结多媒体常用的特征 表示方法,然后从可视化的通用目的出 发,分析他们的内在一致性. 多媒体信息可视化的核心工作可以用图1来表 示_3』.该框架分为三层:第一层是原始数据层,用来收 集不同种类的信息源;第二层是关系特征层,主要处理 可视化所需要的信息属性,概念,结构和各种模式等可 视化对象;第三层是视图对象层,用来完成将各种可视 化对象映射成视图对象,从而完成可视化结果的显示. 框架中的主要部件可以分为两类:一类是各级数 图1信息可视化的框架简图 收稿日期:2o【)9—12—01修回日期:2010…0215 作青简介:杨峰(1968一).男,博士,副教授.研究方向为信息可视化,网络信息组织,信息管理与电子商务. 视图对象层 特征关系层 原始数据层 ? 16O?情报杂志第29卷 据库,主要有:a.数据源,分成其他数据源和系统内原 始数据库.原始数据库的数据是从系统外获得的,分 为三种不同类型,文本数据库,用来存储如科技期刊之 类的大文本信息;图像数据库存储各类图片信息及他 们的文字说明;音频数据库存储各类音频信息及文字 说明.b.特征库,存储从原始数据库中提出不同媒体 的特征.C.结构式库,存储可视化对象.d.图符 库,存储标准图符,用于最终视图对象的形成,完成可 视化对象的显示. 另一类是一些关键处理模块,包括:a.导人模块, 将系统外的信息源就导入;b.特征提取,从原始数据库 中分析出表示信息本质的过程是特征提取;c.可视化 算法,计算多媒体信息集合的特征,得出对应的结构关 系或模式;d.映射,映射的功能是将可视化对象中的属 性,概念,模式,结构等与图符库中选中的图符进行组 合形成适合屏幕显示的视图对象. 信息可视化首先需要进行合适的特征表示,在具 体采用的表示方法上进行特征抽取,进而进行可视化 分析.由于不同的媒体种类的信息有不同的特征表示 方法,同时不同学科领域也各自有着一些成熟经验,因 此,需要按照信息可视化技术的特点,将合适的特征表 示方法用于信息可视化中. 2多媒体信息特征的向量表示 上述框架的一个优势是便于用相同的可视化算法 处理不同类型的信息.完成该工作的关键步骤是多媒 体的特征表示,我们选用向量形式是基于以下一些原 因. 首先,文本,图像和音频信息各有很多独自的特征 表示形式,向量形式是都有的.如文本可以用词向量, 图像的颜色,纹理,形状等特征最后也可以用向量表 示,音频的特征也可以在不同层级上形成特征向量;其 次,可视化算法可以针对多种特征进行分析,从目前的 研究状况来看,基于向量的处理最为成熟.也就是说, 如果用向量表示信息特征,最后的可视化结果最让用 户满意;同时,上述框架的思路是力图用较少的模块完 成可视化任务,因此,对于不同媒体的信息,如果多媒 体的特征在表示格式上一致的,则文本

文档评论(0)

zhangningclb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档