数据可视化基础第十一章_多元数据的可视化.docx

数据可视化基础第十一章_多元数据的可视化.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

1

第十一课多元数据的可视化

学习目标

学习目标

了解多元数据可视化的方法

了解多种多元数据可视化图表适合的数据类型

完成部分多元数据的可视化图表实现

能力目标

能够根据数据选择合适的多元数据可视化图表

合理的设计多元数据可视化图表

完成部分多元数据的可视化图表

2

多元数据

高维多元数据是指每个数据对象有两个或是两个以上的独立(多维度)或是相关(多元)属性的数据。因为多数情况下,并不能判断数据对象之间是否是相互独立的,所以通常统称为多元数据。

此类数据在现实生活中随处可见,例如笔记本电脑的不同配置,包括CPU,内存,硬盘,屏幕和重量等等。每个参数都是电脑的一个属性,所有参数组成的配置就是一个多元数据。

人们在选择电脑的时候,通常需要比较各种重要的参数,衡量不同型号之间的优劣。实际上就是对数据对象在各个属性上的数值进行综合评估。这就是一个典型的多元数据分析的工过程

少数维度

二维或是三维数据,都可以用常规的可视化方法表示。例如通过散点图,通过x轴y轴的位置比较二维数据,或是通过各种视觉编码表示额外的属性,比如点的颜色,大小,形状等。我们看过多次的GapMinder的GDP和期望寿命的散点图就是此类。通过x,y轴,颜色,大小代表了4个维度的数据关系。

但是,这种方法对更高维度的数据就不合适,视觉编码有限,多余复杂的视觉编码会降低可读性,需要其他方法,在二维空间中表现更多元的数据。

3

高维多元数据

散点图矩阵

一种常用的方法是散点图矩阵。就是散点图的扩展,对N维数据,通过N*N个散点图特别表示N个属性之间的两两关系。例如,下图就是经济合作组织(OECD)对各个国家的各阶段人口分布,人口密度等因素之间的两两对比的散点图矩阵,可以看到老年人口越多的国家,老年人口负担也就越重。

这种图的好处是符合用户习惯,并能够有效解释属性之间的关系。但是也存在着缺陷,维度增加后,散点图数量也几何级增长。通常的解决方法是,通过交互式手段,选取感兴趣的属性进行分析。这样是常用的灵活的解决方案

表格透镜

4

表格透镜是传统表格的扩展。它采用和传统表格类似的方法,每个数据对象用一行表示,每列表示一个属性,但是和传统方法不同的是,表格透镜并不直接列出数据的值,而是将数值用水平横条或是点来表示,因为点或是横条占用空间较少,可以在有限的屏幕空间中显示大量的数据和属性,同事方便用户对数据对象和各个属性值之间并进行比较。如图同样是OECD各个国家的各阶段人口分布,可以看到通过横线代表数值大小,更加清晰的看出相互之间的规律。

平行坐标

平行坐标是展示多元数据的另一种有效方法。传统的图表中,坐标轴相互垂直,每个数据对象对应于坐标系中的一个点。而平行坐标方法中采用相互平行的坐标轴,每个坐标轴代表数据的一个属性,因此每个数据对象对应于一条穿过所有坐标轴的折线。同样,OECD的数据,针对每个国家的情况可以通过一条直线代表各个参数之间关系

5

平行坐标不但可以显示高维度的数据,还可以解释数据在每个属性上的分布,以及相邻两个属性之间的关系。通过线段的关系可以判断两个属性之间是正相关性,负相关性还是弱相关性。

正相关性

负相关性

弱相关性

但是,对于非相邻属性之间关系的表现相对较弱。通常的解决方法是,让用户用交互的选取部分感兴趣的数据对象以及属性,并且可以交换坐标轴的位置,改变相邻关系,查看属性之间的关系,如果需要突出某个数据,可以用高亮显示。

以上的例子中,数据在各个维度上都是连续的数值,但是如果是类别型数据,通常将坐标轴平均的分成若干等分,并连接对应的等分点。下图是泰坦尼克号沉船事故中乘客信息的例子,包括三个维度,乘客的船舱等级,性别以及是否遇难的三维数据。在每个坐标上,用区间表示不同的属性,区间的大小有对应属性的数据所占的比例决定。例如,所有乘客中,1731人为男性,470人为女性,性别坐标轴就有相应的宽度代表男性乘客和女性乘

客。

文档评论(0)

聚好信息咨询 + 关注
官方认证
服务提供商

本公司能够提供如下服务:办公文档整理、试卷、文档转换。

认证主体鹤壁市淇滨区聚好信息咨询服务部
IP属地河南
统一社会信用代码/组织机构代码
92410611MA40H8BL0Q

1亿VIP精品文档

相关文档