网站大量收购独家精品文档,联系QQ:2885784924

大数据管理与应用 课件 第十三章 数据可视化.pptx

大数据管理与应用 课件 第十三章 数据可视化.pptx

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第十三章数据可视化大数据管理与应用——主编:王刚副主编:刘婧、邵臻

01可视化概述02可视化主要类型03可视化主要方法04可视化评测

图形是直观呈现数据的形式,然而,将大量数据在同一个图表中画出来并不容易。数据可视化就是研究利用图形展现数据中隐含的信息并发掘其中规律的学科。它是一门横跨计算机、统计、心理学的综合学科,并随着数据挖掘和大数据的兴起而进一步繁荣。1可视化概述

可视化的历史悠久,从最早用墙上的原始绘图和图像、表中的数字以及黏土上的图像来呈现信息,到数据驱动时代的大数据可视化,大致可分为如图13-1所示的8个阶段:1.1可视化发展图13-1可视化发展时间轴

在计算机学科的分类中,利用人眼的感知能力对数据进行交互的可视表达以增强认知的技术,称为可视化。从宏观的角度看,可视化包括以下三个功能:信息记录:可视化可以将大规模的数据记录下来,最有效的方式就是将信息成像或采用草图记载。信息推理与分析:将信息以可视的方式呈现给用户,引导用户从可视化结果分析和推理出有效信息。信息传播与协同:将复杂信息传播与发布给公众的最有效途径就是将数据进行可视化,以达到信息共享、信息协作、信息修正和信息过滤等目的。1.2可视化功能

数据可视化大致可分为信息可视化、科学可视化和可视化分析三大类。由于可视化类型不同,可视化分析的流程模型略有不同,本质上还是离不开四步:分析、处理、生成、交互,如图13-5所示。1.3可视化流程图13-5可视化分析的流程

分析:进行一个可视化任务时,首先要进行一系列分析工作,从总体上看,分析阶段包括三项任务:任务分析、数据分析、领域分析。处理:分析工作完成之后,接下来进行对数据的处理和对视觉编码的处理两部分工作。数据的处理包括数据清洗、数据规范和数据分析。视觉编码处理即如何使用位置、尺寸、灰度值、纹理、色彩、方向、形状等视觉通道,来映射要展示的每个数据维度。生成:生成可视化结果,即将视觉编码设计运用到实践中。从巨大的呈现多样性的空间中选择最合适的编码形式,这也正是数据可视化的核心内容。交互:对数据进行可视化和分析的目的是解决目标任务。通用的目标任务可分成三类:生成假设、验证假设和视觉呈现。交互是通过可视的手段辅助分析决策的直接推动力。1.3可视化流程

数据可视化的处理对象是数据。自然地,数据可视化包含处理科学数据的科学可视化与处理抽象的、非结构化信息的信息可视化两个分支。科学可视化重点探索如何有效地呈现数据中几何、拓扑和形状特征,实现科学数据的交互式视觉呈现以加强认知。信息可视化的处理对象是非结构化、非几何的抽象数据,针对大尺度高维数据减少视觉混淆对有用信息的干扰。除此之外,将可视化与分析结合,形成一个新的学科:可视分析学。2可视化主要类型图13-6数据可视化分支

科学可视化是可视化领域之中最早、最成熟的一个跨学科研究与应用领域。其主要关注三维现象的可视化,侧重于利用计算机图形学来创建客观的视觉图像,将这些学科中的数学方程等文字信息大量压缩呈现在一张图纸上,如图13-7所示:2.1科学可视化图13-7科学可视化视觉图像

科学可视化设计有可视化流程的参考体系模型,并运用在数据可视化的系统中。图13-8是科学可视化的早期可视化流水线。这条流水线其实是数据处理与图形绘制的嵌套组合。2.1科学可视化图13-8科学可视化的早期可视化流水线鉴于数据的类别可分为标量(密度、温度)、向量(风向、力场)、张量(压力、弥散)三类,科学可视化也可粗略地分为三类。

标量指单个数值,即在每个记录的数据点上有一个单一的值,标量场指二维、三维或四维空间中每个采样处都有一个标量值的数据场。可视化数据场的标准做法有如下表13-1所示的三种。2.1.1标量场可视化表13-1标量场可视化方法

向量场在每个采样点处都是一个向量(一维数据组)。向量场可视化主要关注点是其中蕴含的流体模式和关键特征区域。除了通过拓扑或几何方法计算向量场的特征点、特征线或特征区域外,对向量场直接进行可视化的方法包括三类,如表13-2所示。2.1.2向量场可视化表13-2向量场可视化方法

张量概念是矢量概念的推广,标量可看作0阶张量,矢量可看作1阶张量。张量是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数。张量场可视化方法分为基于纹理、几何和拓扑三类,如表13-3所示。2.1.3张量场可视化表13-3张量场可视化方法

信息可视化是研究抽象数据的交互式视觉表示以加强人类认知。信息可视化的核心问题主要包含高维数据的可视化、数据间各种抽象关系的可视化、用户的敏捷交互和可视化有效性的评断等。图13-10是由Card等提出的经典信息可视化参考模型(ReferenceModel)。目前几乎所有著名的信息可视化系统和工具包都支持这个模型,且绝大

您可能关注的文档

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档