- 1、本文档共30页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
1数据可视化
第一章Matplotlib的基本使用第二章Matplotlib的进阶使用第三章…第四章目录Contents…第五章数据可视化概述2
第十章银行产品客户复购数据可视化分析案例1234数据查看与准备客户基本特征分析复购影响因素分析可视化大屏3
数据查看与准备1.4
1数据查看与准备本章的案例数据为阿里云天池大赛关于金融数据分析赛题(银行客户认购产品预测)所用数据*,数据包括客户个人基本特征、银行营销数据以及宏观经济数据。本章选用公开的“train”子数据集文件。5
1数据查看与准备字段说明age年龄job工作marital婚姻education受教育程度default是否违约housing是否有房贷loan是否有贷款contact联系方式month上一次联系的月份day_of_week上一次联系是星期几duration上一次联系时长(秒)campaign联系次数pdays上一次联系后的间隔天数previous本次活动前联系次数poutcome之前的营销结果emp_var_rate就业变动率cons_price_index消费者价格指数cons_conf_index消费者信心指数lending_rate3m银行同业拆借率3个月利率nr_employed雇员人数subscribe是否复购*数据来源/competition/entrance/531993/information,注册后即可下载6
1数据查看与准备(1)查看train数据集importpandasaspd#导入模块pandas,便于处理数据file_path=rD:\数据分析教材#数据文件路径data=pd.read_csv(file_path+\\train.csv)#导入数据data.head()#查看数据前5行运行结果如图10.17
1数据查看与准备(2)查看是否存在缺失值运行结果如图10.2data.isnull().any()#查看数据是否存在缺失值8
1数据查看与准备(3)修改字段名将数据集字段名以及“subscribe”字段数据转换成为中文。#将数据列名更改为中文,方便数据处理new_col=[序号,年龄,工作,婚姻,受教育程度,是否违约,是否有房贷,是否有贷款,联系方式,上一次联系月份,上一次联系星期,上一次联系时长(秒),联系次数,上一次联系后的间隔天数,本次活动前联系次数,之前营销结果,就业变动率,消费者价格指数,消费者信心指数,银行同业拆借率3个月利率,雇员人数,是否复购]data.columns=new_col#将subscribe(是否复购)的值更改为复购与未复购,便于理解data.loc[:,是否复购].replace({yes:复购,no:未复购},inplace=True)9
客户基本特征分析2.10
2客户基本特征分析(1)客户年龄特征分析数据集中关于客户基本特征的相关数据包含了客户的年龄数据,若想要直观地查看客户群体的年龄分布规律,可以利用Matplotlib库绘制客户年龄直方图。importmatplotlib.pyplotasplt#导入matplotlib.pyplot模块绘图plt.rcParams[font.family]=SimHei#将字体设置为黑体plt.rcParams[axes.unicode_minus]=False#显示负号?plt.figure(figsize=(12,8),dpi=72)#设置图片大小plt.title(客户年龄分布直方图,fontsize=20)#设置标题,并将字体大小设置为20plt.hist(data[年龄],color=cornflowerblue)#绘制直方图,并设置颜色plt.grid(True)#显示网格plt.xlabel(年龄(岁),size=25)#设置x轴plt.ylabel(人数(人),size=25)#设置y轴plt.xticks(size=20)#设置x轴刻度,并将字体大小设置为20plt.yticks(size=20)#将y轴刻度字体设置为20plt.show()#显示图像11
2客户基本特征分析(2)客户年龄特征分析数据集中银行与客户的上一次联系时长数据为一组连续型数据,为了查看上一次联系时长的分布情况,可以利用Matplotlib库绘制联系
您可能关注的文档
- 第1章 数据可视化概述.pptx
- 数据可视化 课件 第2章 Matplotlib 的基本使用.pptx
- 数据可视化 课件 第3章 Matplotlib的进阶使用.pptx
- 数据可视化 课件 第4章 Seaborn的使用.pptx
- 数据可视化 课件 第5章 Plotly数据可视化入门.pptx
- 数据可视化 课件 第6章 Plotly数据可视化进阶.pptx
- 数据可视化 课件 第7章 Pyecharts入门.pptx
- 数据可视化 课件 第8章 Pyecharts进阶.pptx
- 数据可视化 课件 第9章 Bokeh的使用.pptx
- 数据可视化 课件 第11章 金融数据可视化分析案例.pptx
- 计量规程规范 JJF 2153-2024强脉冲光治疗仪校准规范.pdf
- 《JJF 2153-2024强脉冲光治疗仪校准规范》.pdf
- JJF 1176-2024(0~2 300) ℃钨铼热电偶校准规范.pdf
- 《JJF 1176-2024(0~2 300) ℃钨铼热电偶校准规范》.pdf
- 计量规程规范 JJF 1176-2024(0~2 300) ℃钨铼热电偶校准规范.pdf
- JJF 2154-2024亚低温治疗仪校准规范.pdf
- 计量规程规范 JJF 2154-2024亚低温治疗仪校准规范.pdf
- 《JJF 2154-2024亚低温治疗仪校准规范》.pdf
- JJF 2180-2024婴儿辐射保暖台校准规范.pdf
- 计量规程规范 JJF 2180-2024婴儿辐射保暖台校准规范.pdf
文档评论(0)