大数据基础 课件 模块7、8 数据可视化、 大数据安全.pptx

大数据基础 课件 模块7、8 数据可视化、 大数据安全.pptx

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
模块七 数据可视化大数据基础 导读主要内容数据可视化概述可视化工具与图表实训重点和难点数据可视化流程。数据可视化工具的使用。 §7.1 数据可视化概述 数据可视化起源于 20 世纪 50 年代兴起的计算机图形学。一直以来,数据可视化都是一个不断发展的概念,它所涵盖的技术方法非常广泛,与信息图表、信息可视化、科学可视化和统计图表密切相关。 §7.1.1 数据可视化的概念 随着信息技术的不断发展,人类已经进入大数据时代,社会每天都会产生海量数据,这些数据中蕴含着巨大的信息量。在对海量数据完成数据采集和预处理、数据分析与挖掘之后,为了更好地观察数据的分布结构,了解数据之间的关系,需要将分析结果直观地显示出来,这就要借助数据可视化技术。数据可视化技术旨在借助图形化手段,将相对复杂和抽象的数据通过可视的方式呈现出来,如图形、图像、动画等,从而方便人们对数据进行理解和认识。这种技术能够将隐藏于海量数据中的信息转化为可被用户直接感知的多种元素,利用图形和图表展示数据之间的关系,并允许用户与可视化数据进行交互,便于用户从数据中获取想要的信息,极大地提高了数据利用率。 §7.1.2 数据可视化的特点 (1)直观展示数据。数据可视化能够帮助人们用简单、美观的视觉格式展示大量复杂的信息,节省时间和资源。还可以通过丰富的图表、多样的配色展示数据差异,突出重要信息。 (2)辅助决策。使用图形和图表来展示数据能更好地呈现数据分析结果,方便人们了解数据之间的联系和发展趋势,为决策提供帮助。 (3)良好的数据可操作性。进行数据可视化操作的时候,人们可以利用交互的方式对数据进行有效的呈现和管理,以便更好地洞察数据之间的关系。 §7.2 可视化工具与图表一、常用的可视化工具1. ECharts ECharts 是一款由百度开源的数据可视化图表库,能够为用户提供直观、生动、可交互、可个性化定制的数据可视化图表。ECharts 使用简单并且种类丰富,包括常规的折线图、柱状图、散点图、饼图、K 线图、用于统计的盒形图、用于地理数据可视化的地图、热力图、线图、用于关系数据可视化的关系图、treemap、旭日图、多维数据可视化的平行坐标,还包括用于 BI 的漏斗图、仪表盘,并且支持图与图的混搭。ECharts 可以兼容当前绝大部分浏览器,并支持移动端缩放和手势操作。 §7.2 可视化工具与图表2. Matplotlib Matplotlib 是 Python 的 2D 绘图库,可以绘制线图、散点图、等高线图、条形图、柱状图、3D 图形以及图形动画等。Matplotlib 图像可以分为画板、画布、子图、图表信息共 4 层结构。其中,画板位于最底层,在导入 Matplotlib 库时就自动存在;画布建立在画板之上,可以在这一层设置参数;子图能将画布分成不同块,实现分面绘图;通过添加或修改子图上的图形信息,可优化图表的显示效果。 §7.2 可视化工具与图表3. Seaborn Seaborn 是基于 Matplotlib 的 Python 可视化库。在 Matplotlib 的基础上进行了更高级的封装,使作图更加容易,用户不需要了解大量底层参数就能使图形变得精致。Seaborn高度兼容 Numpy 与 Pandas 数据结构以及 scipy 与 statsmodels 等统计模式。 Seaborn 具有以下特点: (1)基于 Matplotlib 绘图风格,增加了一些绘图模式。 (2)增加调色板功能,利用色彩丰富的图像显示数据模式。 (3)面向整个数据集,可显示多个变量之间的关系。 §7.2 可视化工具与图表 (4)可视化单变量和双变量分布以及在数据子集间进行比较。 (5)不同种类因变量的线性回归模型的自动估计和绘图。 (6)方便查看复杂数据集的整体结构。 (7)灵活处理时间序列数据。 (8)利用网格建立复杂图像集。4. Tableau Tableau 能够帮助用户快速分析数据并可视化,实现瞬时共享信息,无论是电子表格、数据库还是 Hadoop 和云服务,均可以轻松可视化。并且可以通过实时连接获取必威体育精装版数据,或者根据日程表完成自动更新。 §7.2 可视化工具与图表二、常用的可视化图表1. 散点图 散点图又称“散点分布图”,如图 7 - 1 所示,将数据以点的形式呈现在坐标系上,并通过数据点的分布形态反映特征的关系。实际应用中,一般使用二维散点图,通过散点的疏密程度和变化趋势表示两个特征的关系,同时能够凸显离群点(异常点)及其对整体的影响。 §7.2 可视化工具与图表图 7 - 1 散点图 §7.2 可视化工具与图表2. 直方图 直方图又称“质量分布图”,如图 7

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档