网站大量收购闲置独家精品文档,联系QQ:2885784924

每日一课 - 数据可视化类别.docx

每日一课 - 数据可视化类别.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
每日一课 | 数据可视化类别 大家好,我是小C,上期给大家分享—— Python数据可视化-“数据科学”的基本概念 本期分享内容:书籍可视化类别 本期小C邀请的是齐伟(Python大学教材及畅销书作者)为我们分享Python数据可视化。 PYTHON “数据可视化类别 走在大街上,满眼都是广告——说明市场经济发达,这是好事情。再观察一下广告,多是以各种样式的图形呈现,而不是简简单单地把数字呈现出来——即使是数字,也想办法把数字搞得像图一样。这样做的目的是要吸引人的注意,并且能够让人一眼就能看到想要看的。 别以为这是广告商的策略,其实,他们只是顺应了大脑的特点(具体请参考有关心理学和脑科学的研究成果)。 因为大脑的这种喜好,所以才非常有必要“数据可视化”,即用某种适合的图形来表示某些数据。 数据可视化的类别 通常有两种可视化数据的方式——这是我提出的分类,如有雷同,纯属巧合: 艺术性可视化 数学性可视化 以 2018 年的中美“贸易战”为例,美国的媒体为了向美国老百姓说明中国经济发展的情况,特别是对美国经济的威胁,一定要使用到中国经济和美国经济相关数字,那么这些数字怎么展示? 图 1 中美 GDP 比较(图片来源) 这是一张预测中美 GPD 走势的图示,看此图,我想,美国人也没有什么太被刺激的感觉,因为看看两条线,未来即使有高低之别,但差别也没有那么吓人,况且,预测还可能不准确呢。 这就是数学性可视化,虽然比较理智的反映了数据。但是,给人的印象不是很深刻,或者没有让人感到受刺激。 再对比图 2: 图 2 艺术性地表示 GDP(图片来源) 虽然这张图中也包含了数字,但是,它同时配置了表示数字的图示,并且都很形象,人的视觉无形中就被图示所吸引了。把数字本来的抽象意义,用直观的方式表达出来,更刺激人的大脑。 这就是将原本的数据通过“艺术性可视化”的方式进行了表达。目的无非是要从视觉的维度让人感受到一种震撼。 “艺术性可视化”,它通常不会科学、准确地反映数据的含义,而是为了某个目的追求感官刺激,比如图 3。 图 3 预测 GDP 变化 (图片来源) 在本达人课中所要介绍的“数据可视化”,肯定不是那种蛊惑人心的可视化,而是本着科学精神的“数学性可视化”,虽然它可能不如“艺术性的可视化”好看,但是,更趋真实地反映了对象的本质。 常见图像和用途 “数学性可视化”,就是要将数据用图像的方式表达。从数学角度来看,不同的图像有不同的用途或目的,下面依次简要说明(此处姑且讨论二维图像)。 散点图 还记得高中物理课学过的折射定律吗?也称为斯涅尔定律,假设不知道,我们就探索一下。用实验的方式分别测量光线入射某透明介质的入射角和折射角大小,测量多次,于是就得到了入射角和折射角的数据集,分别用 alpha 和 belta 表示。 有了这两组数据,怎么研究入射角和折射角之间的关系呢?它们之间符合什么函数关系? 一种常用的方法是: 建立一个坐标系,横坐标表示入射角,纵坐标表示折射角; 将入射角及其对应的折射角,作为坐标系中的一个坐标点,在此坐标系中把点标记出来。 这样就在坐标系中“散落”了很多点,如图 4 所示: 图 4 入射角和折射角散点图 接下来的任务就是观察这些点在坐标系中的分布,猜测它们应该符合什么函数关系,比如可能符合某个一次函数关系等(看起来像符合正比例函数的关系,人类曾经很长时间都这么认为,直到伟大的物理学家斯涅耳揭示了其中的奥秘为止)。 通过这个例子,可以总结如下: 绘制散点图,要有对应的两组数据(二维图); 两组数据所对应的两个变量是连续变量; 散点图的用途在于发现变量之间的关系。 在实际业务中,散点图的样式可能具有多种,而且也不一定都是用来寻找某种函数关系。比如在地图上用色彩深浅画出各个城市的 PM2.5 指数,这也是一种散点图,通过这种散点图就能够看到污染城市的地理分布规律。 柱形图 柱形图(也称为:柱状图),适用于二维数据集,但是有一个维度的数据需要具有比较意义。比如下面的数据: 对于这份数据,就比较适合用柱形图进行可视化。 图 5 部分省 GDP 柱形图 图中所示的柱子高度,表示数据表中各省的 GDP 值。 通过柱形图,非常明显地反映了各省 GDP 数据的差异。 但是注意,柱形图不适合大数据,在横坐标上如果排满了柱子,看着多眼晕呀。 条形图 条形图,貌似就是柱状图横过来,对于数值都是大于 0 的数据而言,画出来的条形图可以这样理解。但是,下面这种类型的数据也是比较常见的。 从数据表中可以看出,我国部分城市 1 月份最低气温,有的在 0℃ 以上,有的在 0℃ 以下。对于这类数据,用条形图显示,结果是这样的。 图 6 部分城市最低温 当然,这份数据也可以用前面的“柱形图”实现可视化。 折线图 下面这份数据,是 1961 ~ 2017 年

文档评论(0)

150****6040 + 关注
实名认证
内容提供者

互联网产品运营推广以及k12教育内容。

1亿VIP精品文档

相关文档