- 1、本文档共108页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
;
本章学习目标;
数据可视化是利用可视化的方式(例如图形、表格等)将数据形象的展
示出来,以更好地帮助阅读者掌握数据信息。
经常用于数据探索、数据结果展示、数据报告等方面,好的可视化会帮助数据数据分析师更好的输出数据信息。;
Matplotlib
这是Python领域内的第一个可视化库,后续其他库大多在此基础上做高级封装和改进。该库功能强大且应用成熟,但问题在于API过于繁杂且缺少交互能力。;
Pandas可视化方法
Pandas中的DataFrame可直接调用plot方法展示常用图形,某些特殊函数也封装了其各自应用的图形,例如自相关图、偏相关图等,因此在数据分析中使用方便;也正因为它是一种高度封装,缺少对细节的定义和控制的灵活性。;
Seaborn
这是基于matplotlib的高级可视化库,它隐藏了很多matplotlib细节配置,通过简单的方法即可产生美观、易用的可视化效果。但如果要对细节做更进一步控制,需要配合matplotlib的其他方法实现。;
Pyecharts
这是基于百度Echarts的可视化库,囊括30+种常见图表且支持多种展示和应用环境。除了灵活、强大的图形和配置项外,还支持与Flask、Django等主流Python框架集成。;;
可视化要表达的信息内容按主题可分为四种:趋势、对比、结构、关系
1.趋势
趋势指事物的发展趋势,例如走势的高低、状态的变化好坏等,通常用于按时间发展的眼光来评估事物的场景。
例如按日的用户数量趋势、按周的订单量趋势、按月的转化率趋势等。
常用的可视化图形是折线图,在时间项较少的情况下,也可以使用柱形图做展示。;
可视化要表达的信息内容按主题可分为四种:趋势、对比、结构、关系
2.对比
对比指不同事物之间或同一事物在不同时间下的优劣等的对照,可直接反应出差异性。
例如新用户与老用户的客单价对比、不同广告来源渠道的订单量和利润率对比等。
常用的可视化图形,在少数对比指标上可选择柱形图、条形图;而多个对象的多个指标的同时对比可用雷达图等。;
可视化要表达的信息内容按主题可分为四种:趋势、对比、结构??关系
3.结构
结构也可以称为成分、构成或内容组成,指的是一个整体内有哪些元素组成,以及各个元素的影响因素或程度的大小。
例如不同品类的利润占比、不同类型客户的销售额占比等。
常用的可视化图形,一般使用饼图及其变体,例如玫瑰图、扇形图、环形图等;如果要查看多个周期或分布下的结构,可使用面积图。;
可视化要表达的信息内容按主题可分为四种:趋势、对比、结构、关系
4.关系
关系指不同事物相互的联系,这种联系可以是多种类型和结构的。
例如,微博转发路径属于一种扩散关系,用户频繁一起购买的商品属于频繁发生
的交叉销售关系,用户在网页上先后浏览的页面属于基于时间序列的关联关系等。
常用的可视化图形,会根据不同的可视化目标选择不同的图形,例如关系图、树形图、漏斗图、散点图等。;;
importmatplotlib.pyplotasplt#①
plt.rc(font,family=SimHei,size=14)#②设置图形的字体为SimHei,大小为14,目的是避免中文显示乱码的问题
plt.rcParams[axes.unicode_minus]=False#③设置当图形中出现负号时可正常显示importpandasaspd#④
importnumpyasnp#⑤
%matplotlibinline#⑥设置图形可直接在Jupyter窗口中嵌入显示,不需要额外调用matplotlib.pyplot的show方法
%configInlineBackend.figure_format=retina#⑦用来设置图形可适用于retina屏幕,这样在高清屏上显示会更加清楚;
(1)x:x轴(横轴)数据列,一般用列标题或位置表示。
(2)y:y轴(纵轴)数据列,一般用列标题、位置表示单列或由其组成的列表表示多列。
(3)kind:展示图形的类型,可选值为line:折线图(默认图形),bar:柱形图,barh:条形图,hist:直方图,box:箱型图,kde:核密度估计图,density:跟kde功能相同,area:面积图,pie:饼图,scatter:散
您可能关注的文档
- python高级数据处理与可视化(50页 ).pptx
- 使用matplotlib进行数据可视化教程(39页).ppt
- 口蹄疫病理变化很容易被误诊.doc
- 刘自逵:三元母猪奶水不足的“前因后果”.doc
- 大学工作人员考核管理办法.doc
- 大学机关、教辅、后勤单位目标考核管理办法.doc
- 大学教职工周转房管理办法.docx
- DB34T 1162.4-2010 行政服务中心标准体系建设指南 第4部分 体系评价 .docx
- DB34T 1284.3-2010 稀土高铁铝合金环保电力电缆 第3部分额定电压35kv (Um = 40.5 kv)电缆 .docx
- DB34T 1604-2018 番茄长季节栽培技术规程 .docx
- DB34T 1447-2011 市民一卡通服务通则.docx
- DB34T 1518-2019 加州鲈鱼种池塘培育技术规程 .docx
- DB34T 1516-2019 河蟹养殖池塘双季套养青虾技术规程.docx
- DB34T 1573-2011 绿色食品 马铃薯、鲜食玉米、大白菜三熟制栽培技术规程 .docx
- DB34T 1436-2011 抗虫玉米MON863及其衍生品种 实时荧光PCR检测方法 .docx
- DB34T 1466-2023 居住建筑节能设计标准.docx
- DB34T 1389-2011 规模猪场高致病性蓝耳病综合防控技术规范.docx
- DB34T 1605-2018 茄子制种技术规程.docx
- DB34T 1488-2011 氨制冷系统压力管道安装监督检验规程.docx
- DB34T 1364-2011 饲料中甲基睾丸酮的测定-高效液相色谱法.docx
文档评论(0)