Python数据可视化详细教程(108页 ).pptxVIP

Python数据可视化详细教程(108页 ).pptx

  1. 1、本文档共108页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Python数据可视化详细教程(108页 )

;

本章学习目标;

数据可视化是利用可视化的方式(例如图形、表格等)将数据形象的展

示出来,以更好地帮助阅读者掌握数据信息。

经常用于数据探索、数据结果展示、数据报告等方面,好的可视化会帮助数据数据分析师更好的输出数据信息。;

Matplotlib

这是Python领域内的第一个可视化库,后续其他库大多在此基础上做高级封装和改进。该库功能强大且应用成熟,但问题在于API过于繁杂且缺少交互能力。;

Pandas可视化方法

Pandas中的DataFrame可直接调用plot方法展示常用图形,某些特殊函数也封装了其各自应用的图形,例如自相关图、偏相关图等,因此在数据分析中使用方便;也正因为它是一种高度封装,缺少对细节的定义和控制的灵活性。;

Seaborn

这是基于matplotlib的高级可视化库,它隐藏了很多matplotlib细节配置,通过简单的方法即可产生美观、易用的可视化效果。但如果要对细节做更进一步控制,需要配合matplotlib的其他方法实现。;

Pyecharts

这是基于百度Echarts的可视化库,囊括30+种常见图表且支持多种展示和应用环境。除了灵活、强大的图形和配置项外,还支持与Flask、Django等主流Python框架集成。;;

可视化要表达的信息内容按主题可分为四种:趋势、对比、结构、关系

1.趋势

趋势指事物的发展趋势,例如走势的高低、状态的变化好坏等,通常用于按时间发展的眼光来评估事物的场景。

例如按日的用户数量趋势、按周的订单量趋势、按月的转化率趋势等。

常用的可视化图形是折线图,在时间项较少的情况下,也可以使用柱形图做展示。;

可视化要表达的信息内容按主题可分为四种:趋势、对比、结构、关系

2.对比

对比指不同事物之间或同一事物在不同时间下的优劣等的对照,可直接反应出差异性。

例如新用户与老用户的客单价对比、不同广告来源渠道的订单量和利润率对比等。

常用的可视化图形,在少数对比指标上可选择柱形图、条形图;而多个对象的多个指标的同时对比可用雷达图等。;

可视化要表达的信息内容按主题可分为四种:趋势、对比、结构??关系

3.结构

结构也可以称为成分、构成或内容组成,指的是一个整体内有哪些元素组成,以及各个元素的影响因素或程度的大小。

例如不同品类的利润占比、不同类型客户的销售额占比等。

常用的可视化图形,一般使用饼图及其变体,例如玫瑰图、扇形图、环形图等;如果要查看多个周期或分布下的结构,可使用面积图。;

可视化要表达的信息内容按主题可分为四种:趋势、对比、结构、关系

4.关系

关系指不同事物相互的联系,这种联系可以是多种类型和结构的。

例如,微博转发路径属于一种扩散关系,用户频繁一起购买的商品属于频繁发生

的交叉销售关系,用户在网页上先后浏览的页面属于基于时间序列的关联关系等。

常用的可视化图形,会根据不同的可视化目标选择不同的图形,例如关系图、树形图、漏斗图、散点图等。;;

importmatplotlib.pyplotasplt#①

plt.rc(font,family=SimHei,size=14)#②设置图形的字体为SimHei,大小为14,目的是避免中文显示乱码的问题

plt.rcParams[axes.unicode_minus]=False#③设置当图形中出现负号时可正常显示importpandasaspd#④

importnumpyasnp#⑤

%matplotlibinline#⑥设置图形可直接在Jupyter窗口中嵌入显示,不需要额外调用matplotlib.pyplot的show方法

%configInlineBackend.figure_format=retina#⑦用来设置图形可适用于retina屏幕,这样在高清屏上显示会更加清楚;

(1)x:x轴(横轴)数据列,一般用列标题或位置表示。

(2)y:y轴(纵轴)数据列,一般用列标题、位置表示单列或由其组成的列表表示多列。

(3)kind:展示图形的类型,可选值为line:折线图(默认图形),bar:柱形图,barh:条形图,hist:直方图,box:箱型图,kde:核密度估计图,density:跟kde功能相同,area:面积图,pie:饼图,scatter:散

文档评论(0)

***** + 关注
实名认证
文档贡献者

信息系统项目管理师持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年08月23日上传了信息系统项目管理师

1亿VIP精品文档

相关文档