- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据可视化 |⽤散点图进⾏数据分析
01
散点图的⽤途有很多,我认为它的核⼼价值,在于应⽤ 关思维,发现变量之间的关系。
散点图就像⼀扇窗,打开它,并仔细观察,能让我们看见更多有价值的信息。
⽐如说,假设表格中有 10000 个客户年龄和消费⾦额的数据:
我们可以计算每⼀个年龄对应的⼈均消费⾦额,⽐如说,所有 20 岁客户的平均消费⾦额约为 1383.69 元,然后我们可
以画出⼀张散点图:
从图中可以看出,客户的年龄与⼈均消费⾦额有很强的 关性,其中应⽤了线性回归算法,得到⼀条拟合的直线,并⽤
公式表⽰出来, 接近于 1 ,代表算法拟合的效果很好。
02
接下来,我们看看具体实现的步骤。
# 导⼊所需的库
importnumpy asnp
importpandas aspd
importmatplotlib asmpl
importmatplotlib.pyplot asplt
fromsklearn.linear_ model importLinearRegression
fromsklearn.prepro essing importPolynomialFeatures
fromsklearn.pipeline importPipeline
# 正常显⽰中⽂标签
mpl.r Params[ font.sans-serif] = [ SimHei]
# ⾃动适应布局
mpl.r Params.update({ figure.autolayout: True})
# 正常显⽰负号
mpl.r Params[ axes.uni ode_ minus] = False
# 禁⽤科学计数法
pd.set_option( display.float_format, lambdax : %.2f% x)
# 定义颜⾊,主⾊:蓝⾊,辅助⾊:灰⾊,互补⾊:橙⾊
= { 蓝⾊: #00589F, 深蓝⾊: #003867, 浅蓝⾊: #5D9BCF,
灰⾊: #999999, 深灰⾊: #666666, 浅灰⾊: #CCCCCC,
橙⾊: #F68F00, 深橙⾊: #A05D00, 浅橙⾊: #FBC171}
其次,从 Ex el ⽂件中读取数据,并调⽤ sklearn 中的算法,得到拟合的直线和评分结果。
# 数据源路径
filepath= ./data/客户年龄和消费⾦额.xlsx
# 读取 Ex el⽂件
df = pd.read_ex el(filepath, index_ ol= 客户编号)
# 定义画图⽤的数据:年龄和⼈均消费⾦额
df_group = df.groupby( 年龄).mean
x = np.array(df_group.index).reshape( -1, 1)
y = np.array(df_group.values)
# ⽤管道的⽅式调⽤算法,以便把线性回归扩展为多项式回归
poly_ reg = Pipeline([
( ploy, PolynomialFeatures(degree= 1)),
( lin_ reg, LinearRegression)
])
# 拟合
poly_ reg.fit(x, y)
# 斜率
oef = poly_ reg.steps[ 1][ 1]. oef_
# 截距
inter ept = poly_ reg.steps[ 1][ 1].inter ept_
# 评分
s ore = poly_ reg.s ore(x, y)
# 使⽤ 「⾯向对象」的⽅法画图,定义图⽚的⼤⼩
# 使⽤ 「⾯向对象」的⽅法画图,定义图⽚的⼤⼩
fig, ax = plt.subplots(figsize=( 8, 6))
# 设置标题
ax.set_title( n客户每年长⼀岁,⼈均消费⾦额增加+ %.2f% oef[ 0][ 1] + 元n, lo = left, size= 26, olor= [ 深灰⾊])
# 画⽓泡图
ax.s atter(x, y, olor= [ 蓝⾊], marker= ., s= 100, zorder= 1)
# # 绘制预测线
y2 = poly_ reg.predi t(x)
ax.plot(x, y2, -, = [ 橙⾊], zorder= 2)
# 隐藏边框
ax.spines[ top].set_visible( False)
ax.spines[ right].set_visible( Fa
文档评论(0)