- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
每日一课 | 数据可视化类别
大家好,我是小C,上期给大家分享—— Python数据可视化-“数据科学”的基本概念
本期分享内容:书籍可视化类别
本期小C邀请的是齐伟(Python大学教材及畅销书作者)为我们分享Python数据可视化。
PYTHON
“数据可视化类别
走在大街上,满眼都是广告——说明市场经济发达,这是好事情。再观察一下广告,多是以各种样式的图形呈现,而不是简简单单地把数字呈现出来——即使是数字,也想办法把数字搞得像图一样。这样做的目的是要吸引人的注意,并且能够让人一眼就能看到想要看的。
别以为这是广告商的策略,其实,他们只是顺应了大脑的特点(具体请参考有关心理学和脑科学的研究成果)。
因为大脑的这种喜好,所以才非常有必要“数据可视化”,即用某种适合的图形来表示某些数据。
数据可视化的类别
通常有两种可视化数据的方式——这是我提出的分类,如有雷同,纯属巧合:
艺术性可视化
数学性可视化
以 2018 年的中美“贸易战”为例,美国的媒体为了向美国老百姓说明中国经济发展的情况,特别是对美国经济的威胁,一定要使用到中国经济和美国经济相关数字,那么这些数字怎么展示?
图 1 中美 GDP 比较(图片来源)
这是一张预测中美 GPD 走势的图示,看此图,我想,美国人也没有什么太被刺激的感觉,因为看看两条线,未来即使有高低之别,但差别也没有那么吓人,况且,预测还可能不准确呢。
这就是数学性可视化,虽然比较理智的反映了数据。但是,给人的印象不是很深刻,或者没有让人感到受刺激。
再对比图 2:
图 2 艺术性地表示 GDP(图片来源)
虽然这张图中也包含了数字,但是,它同时配置了表示数字的图示,并且都很形象,人的视觉无形中就被图示所吸引了。把数字本来的抽象意义,用直观的方式表达出来,更刺激人的大脑。
这就是将原本的数据通过“艺术性可视化”的方式进行了表达。目的无非是要从视觉的维度让人感受到一种震撼。
“艺术性可视化”,它通常不会科学、准确地反映数据的含义,而是为了某个目的追求感官刺激,比如图 3。
图 3 预测 GDP 变化 (图片来源)
在本达人课中所要介绍的“数据可视化”,肯定不是那种蛊惑人心的可视化,而是本着科学精神的“数学性可视化”,虽然它可能不如“艺术性的可视化”好看,但是,更趋真实地反映了对象的本质。
常见图像和用途
“数学性可视化”,就是要将数据用图像的方式表达。从数学角度来看,不同的图像有不同的用途或目的,下面依次简要说明(此处姑且讨论二维图像)。
散点图
还记得高中物理课学过的折射定律吗?也称为斯涅尔定律,假设不知道,我们就探索一下。用实验的方式分别测量光线入射某透明介质的入射角和折射角大小,测量多次,于是就得到了入射角和折射角的数据集,分别用 alpha 和 belta 表示。
有了这两组数据,怎么研究入射角和折射角之间的关系呢?它们之间符合什么函数关系?
一种常用的方法是:
建立一个坐标系,横坐标表示入射角,纵坐标表示折射角;
将入射角及其对应的折射角,作为坐标系中的一个坐标点,在此坐标系中把点标记出来。
这样就在坐标系中“散落”了很多点,如图 4 所示:
图 4 入射角和折射角散点图
接下来的任务就是观察这些点在坐标系中的分布,猜测它们应该符合什么函数关系,比如可能符合某个一次函数关系等(看起来像符合正比例函数的关系,人类曾经很长时间都这么认为,直到伟大的物理学家斯涅耳揭示了其中的奥秘为止)。
通过这个例子,可以总结如下:
绘制散点图,要有对应的两组数据(二维图);
两组数据所对应的两个变量是连续变量;
散点图的用途在于发现变量之间的关系。
在实际业务中,散点图的样式可能具有多种,而且也不一定都是用来寻找某种函数关系。比如在地图上用色彩深浅画出各个城市的 PM2.5 指数,这也是一种散点图,通过这种散点图就能够看到污染城市的地理分布规律。
柱形图
柱形图(也称为:柱状图),适用于二维数据集,但是有一个维度的数据需要具有比较意义。比如下面的数据:
对于这份数据,就比较适合用柱形图进行可视化。
图 5 部分省 GDP 柱形图
图中所示的柱子高度,表示数据表中各省的 GDP 值。
通过柱形图,非常明显地反映了各省 GDP 数据的差异。
但是注意,柱形图不适合大数据,在横坐标上如果排满了柱子,看着多眼晕呀。
条形图
条形图,貌似就是柱状图横过来,对于数值都是大于 0 的数据而言,画出来的条形图可以这样理解。但是,下面这种类型的数据也是比较常见的。
从数据表中可以看出,我国部分城市 1 月份最低气温,有的在 0℃ 以上,有的在 0℃ 以下。对于这类数据,用条形图显示,结果是这样的。
图 6 部分城市最低温
当然,这份数据也可以用前面的“柱形图”实现可视化。
折线图
下面这份数据,是 1961 ~ 2017 年
您可能关注的文档
- 《2021年度中国数字地产行业发展白皮书》重磅发布! 发现地产数字化增长引擎.docx
- 【每月一荐读后感】儿二科集锦.docx
- 2021吉林大学社工考研第一名经验分享 -- 社工考研真题.docx
- 初二我的学校小天地作文300字(精选3篇).docx
- 第一场雪作文(精选10篇).docx
- 关于粽子的作文800字(精选10篇).docx
- 管理体系标准免费查询网址.docx
- 荷花作文300字(精选5篇).docx
- 记录控制程序.docx
- 六西格玛项目案例.docx
- 浙江省县域教研联盟2024-2025学年高三上学期12月模拟考试技术试题-高中信息技术2.docx
- 湖南省岳阳市云溪区2024-2025学年高三上学期11月期中地理试题.docx
- 浙江省杭州市北斗联盟2024-2025学年高一上学期期中联考政治试题2.docx
- 广东省肇庆市实验中学高三理科化学第16周限时训练.doc
- 黑龙江省牡丹江市第一高级中学2024-2025学年高一上学期11月期中地理试题2.docx
- 云南省玉溪市峨山一中2017-2018学年高二四月份月考生物试题.doc
- 山东省实验中学高三第三次诊断考试历史试题.docx
- 山东省菏泽第一中学2024-2025学年高二上学期第一次月考历史试题含答案.docx
- 山东省菏泽市2024-2025学年高一上学期11月期中数学试题(A)含解析.docx
- 安徽省六安市舒城中学高三仿真(一)文科综合试题.doc
文档评论(0)