数据分析师-数据分析师基础-数据可视化_数据可视化的历史与发展.docx

数据分析师-数据分析师基础-数据可视化_数据可视化的历史与发展.docx

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE1

PAGE1

数据可视化的起源与早期发展

1数据可视化的概念与定义

数据可视化是一种将数据转换为图形或图像的技术,使数据更易于理解和分析。它不仅仅是图表的绘制,更是一种艺术,将复杂的信息以直观的方式呈现,帮助人们发现数据中的模式、趋势和异常。数据可视化的核心在于将抽象的数字和概念转化为视觉元素,如点、线、面、颜色和纹理,从而增强数据的可读性和可解释性。

2古代数据可视化实例:星图与地图

2.1星图

星图是古代数据可视化的一种形式,用于记录和展示天体的位置和运动。例如,古埃及的星图,记录了夜空中星星的排列,帮助人们理解季节变化和时间的流逝。星图的绘制需要精确的天文观测和对天体运动规律的理解。

2.2地图

地图是另一种古老的数据可视化形式,用于表示地理信息。古代的地图,如托勒密的《地理学》中的地图,不仅展示了地理特征,还反映了当时人们对世界的认知。地图的绘制涉及地理坐标、比例尺和符号系统,以准确地表示地球表面的特征。

3文艺复兴时期的数据可视化:威廉·普莱费尔的工作

威廉·普莱费尔(WilliamPlayfair)是18世纪末至19世纪初的苏格兰工程师和统计学家,被誉为现代统计图表的创始人。他发明了折线图、条形图和饼图,这些图表至今仍被广泛使用。普莱费尔的工作展示了如何通过图形来表达经济数据,使数据的比较和分析变得更加直观。

例如,普莱费尔的折线图用于展示英国的进口和出口数据随时间的变化。这种图表清晰地显示了数据的趋势,帮助人们理解经济活动的周期性和波动性。

4工业革命与数据可视化:统计图表的兴起

工业革命时期,随着数据的大量产生,统计图表成为了一种重要的工具,用于分析和展示数据。统计图表的兴起,不仅促进了数据的可视化,还推动了数据分析和统计学的发展。

4.1统计图表的兴起

在工业革命期间,工厂的生产数据、人口普查数据、疾病传播数据等大量涌现,这些数据的复杂性和规模要求更有效的可视化方法。统计图表,如直方图、散点图和箱线图,开始被广泛使用,以帮助人们理解和分析这些数据。

4.1.1直方图示例

直方图是一种用于展示数据分布的图表,它将数据分为若干区间,并显示每个区间内数据的频率。下面是一个使用Python的matplotlib库绘制直方图的例子:

importmatplotlib.pyplotasplt

importnumpyasnp

#数据样例

data=np.random.randn(1000)

#绘制直方图

plt.hist(data,bins=20,color=blue,alpha=0.7)

plt.title(数据分布直方图)

plt.xlabel(值)

plt.ylabel(频率)

plt.show()

在这个例子中,我们使用了numpy库生成1000个随机数,这些数遵循标准正态分布。然后,我们使用matplotlib库的hist函数绘制直方图,将数据分为20个区间,并设置了图表的标题、x轴和y轴的标签。

4.1.2散点图示例

散点图用于展示两个变量之间的关系。下面是一个使用Python的matplotlib库绘制散点图的例子:

importmatplotlib.pyplotasplt

importnumpyasnp

#数据样例

x=np.random.rand(50)

y=np.random.rand(50)

#绘制散点图

plt.scatter(x,y,color=red)

plt.title(散点图示例)

plt.xlabel(X轴变量)

plt.ylabel(Y轴变量)

plt.show()

在这个例子中,我们生成了两个随机变量x和y,每个变量包含50个随机数。然后,我们使用scatter函数绘制散点图,展示了x和y之间的关系。

4.1.3箱线图示例

箱线图用于展示数据的分布情况,包括中位数、四分位数和异常值。下面是一个使用Python的matplotlib库绘制箱线图的例子:

importmatplotlib.pyplotasplt

importnumpyasnp

#数据样例

data=np.random.randn(100)

#绘制箱线图

plt.boxplot(data)

plt.title(数据分布箱线图)

plt.ylabel(值)

plt.show()

在这个例子中,我们使用numpy库生成了100个随机数,这些数遵循标准正态分布。然后,我们使用boxplot函数绘制箱线图,展示了数据的分布情况,包括中位数、四分位数和异常值。

数据可视化的起源与早期发展,从古代的星图和地图,到文艺复兴时期威廉·普莱费尔的统计图表,再到工业革命时期的统计图表的广泛应用,展示了人类对数据可

文档评论(0)

kkzhujl + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档