- 1、本文档共115页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章_高维非空间数据可视化教程
高维数据可视化
主讲人: 刘天亮
liutl@
TEL: 南京邮电大学图像处理与图像通信江苏省重点实验室
大数据和高维数据可视化
目录
数据维度
高维数据可视化
数据变换
数据呈现
数据交互
数据维度
一维数据
二维数据
三维数据
Elmqvist et al. IEEE TVCG 2008
多维数据
身高
体重
年龄
性别
教育程度
籍贯
张三
180cm
65kg
23
男
大学
上海
李四
168cm
55kg
18
女
高中
浙江
赵五
175cm
75kg
53
男
初中
广东
…
简单的思路
增加视觉通道,以表达更多的属性信息
散点的形状、填充形式、颜色、大小等
简单的思路
多视图协调关联
更高维度
增加视觉通道?
– 人眼能同时处理的视觉通道只有5-7种
• 增加视图?
– 每一视图都只能显示数据的局部属性
难以直观显示数据的整体属性
在信息可视化中,现实的数据往往具有很高的维度
高维数据特点
真实的数据虽然具有较高维度,但不同的属性之间往往具有非常强的内在关联性
例如汽车样本数据可能同时包含:
高维数据特点
高维vs 多元
– 高维:数据具有多个独立属性
– 多元:数据具有多个相关属性
高维数据可视化
7.1 高维数据变换
降低维度
目的:使用线性或非线性变换把高维数据投影到低维空间
核心问题:投影保留高维空间的重要信息和特征关系(无信息损失;保持数据区分等)
降维方法
将高维数据压缩在低维可以显示的空间中,设计新的可视化空间,直观程序不同维度的相似程度。
线性方法
* 主成分分析(PCA)
* 多维尺度分析(Multidimensional Scaling,MDS)
* 非负矩阵分解(NMF)
非线性方法
* ISOMAP
* 局部线性嵌套(LLE)
7.1.1 主成分分析(PCA)
最大化投影后的方差
最小化投影后的损失
原始坐标轴
主成分分析(PCA)
最大化投影后的方差
最小化投影后的损失
原始坐标轴
方差 (1/2)
方差描述变量的信息量
方差 (2/2)
最大化投影后的方差
特征向量
特征值谱
PCA 应用于脸部数据
64 x 64 = 4096
PCA 应用
人脸数据:每一幅人脸图像具有64*64=4096维特征。
把每个脸部重建为一系列人脸基或特征人脸的线性组合。
平均的人脸
重建
90%的方差是可以被前50个特征向量捕获
只需50张基图像就可以重建存在的人脸
基于PCA的可视化过程
问题:
主成分难以理解
空间转换难以联系
方法:
基于PCA的可视化过程
Müller et al. APVIS 2006
用第一主成分排列数据
关联映射空间和原始空间
7.1.2 多维尺度分析(MDS)
基于数据集相似程度的降维方法
在某些情况下,只能够衡量数据点之间的距离
多维尺度分析(MDS)
输入
数据点X间的相似矩阵M,以及投影的维度K
输出
所有数据点在K维平面上的坐标Y
投影空间(平面)中点对间的相似度尽量逼近原始空间的相似度
目标函数
MDS与PCA
如果将数据点的相似度定义为数据点之间的欧式距离,那么MDS等价于PCA
MDS允许定义不同的相似度,因而更加灵活
实例:美国地图
已知一些城市间的距离
MDS的结果
MDS的运用案例分析
Cui et al. IEEECGA 2010
数据呈现
7.2 高维数据呈现方法
基于点的方法 —— 散点矩阵、径向布局
基于线的方法 —— 线图、平行坐标、径向轴
基于区域的方法 —— 柱状图、表格显示、像素图、维度堆叠、马赛克图
基于样本的方法 —— 切尔诺夫脸谱图、邮票图
高维数据呈现方法
基于点的方法——散点矩阵、径向布局
基于线的方法——线图、平行坐标、径向轴
基于区域的方法——柱状图、表格显示、像素图、维度堆叠、马赛克图
基于样本的方法——切尔诺夫脸谱图、邮票图
散点矩阵
散点矩阵
使用一个二维散点图表达每对维度之间的关系
直观显示两个维度间的相关性
散点图数目与数据维度平方成正比
散点矩阵
当数据维度3时,可将散点图作为基础显示方式,融合改进的可视化设计与交互:
维度子集
数据降维
属性编码
多图显示
多图显示最常用的方法是散点图矩阵
散点图矩阵改进
使用自动方法寻找散点图矩阵中可能感兴趣的散点图
聚类特征
维度相关性特征
A. Tatu, G. Albuquerque, M. Eisemann, P. Bak, H. Theisel, M. Magnor, and D. Keim, “Automated Analytical Methods to Support Visual Exploration of H
您可能关注的文档
- 第七章海流观测教程.pptx
- 第七章翻译活动会遇到什么矛盾教程.pptx
- 第七章资源税法与土地增值税练习题教程.doc
- 第七章进出口货物退税教程.pptx
- 汽化和液化-习题.ppt
- 汽车后市场的现状及发展趋势.pptx
- 第七章移动商务资源的价值开发教程.pptx
- 第七章酶教程.pptx
- 第七篇安全责任目标考核教程.doc
- 第七节二次衬砌刘教程.pptx
- 五位一体教案教学教案设计.docx
- 思修与法基-教学教案分享.pptx
- 大学军事之《中国国防》题库分享.docx
- 2023版毛泽东思想和中国特色社会主义理论体系概论第五章-中国特色社会主义理论体系的形成发展.pdf
- 思修与法基 教学全案分享.docx
- 大学军事之《军事思想》题库分享.docx
- 《经济思想史》全套课件-国家级精品课程教案课件讲义分享.pdf
- 厦门大学国际金融全套资料(国家级精品课程)--全套课件.pdf
- 2023版毛泽东思想和中国特色社会主义理论体系概论第五章-中国特色社会主义理论体系的形成发展.docx
- 2023版毛泽东思想和中国特色社会主义理论体系概论第五章中国特色社会主义理论体系的形成发展分享.pdf
文档评论(0)