- 1、本文档共12页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向信息可视化的多媒体信息特征的向量表示研究.doc
面向信息可视化的多媒体信息特征的向量表示研究
第29卷第4期
2010年4月
情报杂志
JOURNAlOFINTELLIGENCE
VoI.29No.4
A0r.2010
面向信息可视化的多媒体信息特征的向量表示研究
ResearchonMulti~mediaInformationFeaturesforInformationVisualization
杨峰
(广东商学院广东省电子商务市场应用技术重点实验室广州510320)
摘要特征表示是信息可视化中一个关键环节.多媒体信息的特征表示决定了对其可视化的质量.从可视化的
通用目的出发,总结多媒体常用的特征表示方法,从中选出适合可视化通用框架的特征表示方法.
关键词信息可视化多媒体特征特征表示
中图分类号TP391G354文献标识码A文章编号1002—1965(2010)04—0159—04
0引言1特征表示
信息可视化是一种对信息进行处理的技术,是情
报学较新的研究热点.它利用视觉形式表示信息和信
息之间的复杂关系,有效的可视化界面使得我们能够
迅速高效地与大型数据集进行交互,从而发现隐藏在
信息内部的关系,特征和规律.
这些信息包括各种媒体,BruceW.H.对互联网电
影库中的428440部电影进行处理,得到可视化的结
果帮助观众选择影片,导演选择演员_lj;
D.Kutz通过可视化25年的专利信息,
预测市场需求的趋势2j.按照信息的媒
体类型将信息特征表示分为文本的特征
表示,图像的特征表示,图形的特征表
示,音频类信息的特征表示和面向信息
可视化的通用的信息特征表示技术.
对于不同种类的信息,他们的特征
描述方法是不一样的.结构化数据和部
分半结构化数据的特征已经有很好的描
述方法,可视化分析可以直接使用.对
于大量的多媒体信息来说,他们是非结
构化信息.对他们特征表示的质量决定
了对其的结构,规律可视化的质量,多媒
体信息特征的表示是对其可视化的一个
关键.本文首先总结多媒体常用的特征
表示方法,然后从可视化的通用目的出
发,分析他们的内在一致性.
多媒体信息可视化的核心工作可以用图1来表
示_3』.该框架分为三层:第一层是原始数据层,用来收
集不同种类的信息源;第二层是关系特征层,主要处理
可视化所需要的信息属性,概念,结构和各种模式等可
视化对象;第三层是视图对象层,用来完成将各种可视
化对象映射成视图对象,从而完成可视化结果的显示.
框架中的主要部件可以分为两类:一类是各级数
图1信息可视化的框架简图
收稿日期:2o【)9—12—01修回日期:2010…0215
作青简介:杨峰(1968一).男,博士,副教授.研究方向为信息可视化,网络信息组织,信息管理与电子商务.
视图对象层
特征关系层
原始数据层
?
16O?情报杂志第29卷
据库,主要有:a.数据源,分成其他数据源和系统内原
始数据库.原始数据库的数据是从系统外获得的,分
为三种不同类型,文本数据库,用来存储如科技期刊之
类的大文本信息;图像数据库存储各类图片信息及他
们的文字说明;音频数据库存储各类音频信息及文字
说明.b.特征库,存储从原始数据库中提出不同媒体
的特征.C.结构式库,存储可视化对象.d.图符
库,存储标准图符,用于最终视图对象的形成,完成可
视化对象的显示.
另一类是一些关键处理模块,包括:a.导人模块,
将系统外的信息源就导入;b.特征提取,从原始数据库
中分析出表示信息本质的过程是特征提取;c.可视化
算法,计算多媒体信息集合的特征,得出对应的结构关
系或模式;d.映射,映射的功能是将可视化对象中的属
性,概念,模式,结构等与图符库中选中的图符进行组
合形成适合屏幕显示的视图对象.
信息可视化首先需要进行合适的特征表示,在具
体采用的表示方法上进行特征抽取,进而进行可视化
分析.由于不同的媒体种类的信息有不同的特征表示
方法,同时不同学科领域也各自有着一些成熟经验,因
此,需要按照信息可视化技术的特点,将合适的特征表
示方法用于信息可视化中.
2多媒体信息特征的向量表示
上述框架的一个优势是便于用相同的可视化算法
处理不同类型的信息.完成该工作的关键步骤是多媒
体的特征表示,我们选用向量形式是基于以下一些原
因.
首先,文本,图像和音频信息各有很多独自的特征
表示形式,向量形式是都有的.如文本可以用词向量,
图像的颜色,纹理,形状等特征最后也可以用向量表
示,音频的特征也可以在不同层级上形成特征向量;其
次,可视化算法可以针对多种特征进行分析,从目前的
研究状况来看,基于向量的处理最为成熟.也就是说,
如果用向量表示信息特征,最后的可视化结果最让用
户满意;同时,上述框架的思路是力图用较少的模块完
成可视化任务,因此,对于不同媒体的信息,如果多媒
体的特征在表示格式上一致的,则文本
文档评论(0)