- 1、本文档共29页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1
相关分析与回归分析
2
学习目标
相关分析、回归分析等数据处理与分析的方法。
掌握相关性分析理论及模型建立的方法
理解相关系数等参数的经济意义
掌握回归分析理论及模型建立的方法
理解拟合度等相关参数的意义
Excel学习重点
Excel中的数据分析工具
回归
相关系数
3
相关分析
相关分析是对两个变量之间线形关系的描述与度量
变量之间是否存在关系?
如果存在关系,他们之间是什么样的关系?
变量之间的关系强度如何?
样本所反映的变量之间的关系能否代表总体变量之间的关系?
相关分析步骤
绘制散点图判断变量之间的关系形态
如果是线形相关,可以用相关系数来度量两个变量之间的关系强度
对相关系数进行显著性检验,以判断样本所反映的关系是否能用来代表两个变量总体上的关系。
4
散点图
通过图形方式对变量之间的关系形态进行大致的描述
A-正相关:一个变量增加或减少时,另一个变量也相应增加或减少;
B-负相关:一个变量增加或减少时,另一个变量却减少或增加;
C-非线性相关:变量之间的关系近似地表现为一条曲线;
D-无相关:说明两个变量是独立的,即由一个变量值,无法预测另一个变量值。
5
相关系数
相关系数:根据样本数据计算的两个变量之间线形相关程度的统计量,用符号“r来表示。
6
相关系数表示的意义
相关系数r是对两变量线性相关的测量,数值的范围从-1到0,到+1,表达变量间的相关强度。
r值为+1表示两组数完全正相关
r值为-1表示两组数完全负相关,说明它们间存在反向关系,一个变量变大时另外一个就变小
当r值为0时表示两变量之间不存在线性关系
相关系数取值范围限于:-1≤r≤+1
Excel中计算相关系数有两种方法
Excel数据分析功能
CORREL()函数
7
加载“分析工具库”
文件/选项/Excel选项
加载项/分析工具库/Excel加载项/单击“跳转”
在加载宏对话框中勾选“分析工具库”
8
示例1-利用Excel数据分析计算相关系数
根据表中的数据计算不良贷款、贷款余额、累计应收贷款、贷款项目个数、固定资产投资额之间的相关系数
法1:数据/数据分析/相关系数/做如下图所示设置
可见,不良贷款与各项贷款余额的相关性最高
示例1-利用Excel数据分析计算相关系数
法2-利用CORREL()函数也可以求出上述任意两个变量之间的相关系数
=CORREL(Array1,Array2)
array1和 array2为需要确定相关性的两组数据
两种方法的区别
方法1可以求出一批变量之间的相关系数
方法2只可以求出2个变量之间的相关系数
10
回归分析
回归分析侧重考察变量之间的数量伴随关系,并通过建立变量之间的数学表达式将这种关系描述出来,进而确定一个或几个自变量的变化对另一个特定变量(因变量)的影响程度,从而由自变量的取值预测因变量的可能值。
从一组样本数据出发,确定变量之间的数学关系式。
对该关系式的可信度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的。
利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的可靠程度。
回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析。按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
11
一元线形回归分析
回归基本上可视为一种拟合过程,即用最恰当的数学方程去拟合一组由一个因变量和一个或多个自变量所组成的原始数据。
最简单的形式是线性回归,它有一个因变量和一个自变量,因此就是用一个线性方程y=a+bx+ε去拟合一系列对变量x和y的数据观察值的过程。
12
回归模型建立的步骤
获取自变量和因变量的观测值;
绘制XY散点图,观察自变量和因变量之间是否存在线性关系;
写出带未知参数的回归方程;
工具-数据分析-回归。
回归方程检验;
R2判断回归方程的拟合优度;
t 统计量及相伴概率值,自变量与因变量之间的关系;
F统计量及相伴概率值,判断方程的回归效果显著性。
进行预测。
13
回归模型的检验
判定系数 R2
用来判断回归方程的拟合优度。 通常可以认为当R2大于0.9时,所得到的回归直线拟合得较好,而当R2小于0.5时,所得到的回归直线很难说明变量之间的依赖关系。
t 统计量
如果对于某个自变量,其t统计量的P值小于显著水平(或称置信度、置信水平),则可认为该自变量与因变量是相关的。
F 统计量
如果F统计量的P值小于显著水平(或称置信度、置信水平),则可认为方程的回归效果显著。
14
示例2-一元回归分析示例
15
散点图与趋势线
根据数据建立散点图
自变量放在X轴,因变量放在Y轴
简单线性拟合
添加趋势线(类型为“线性”),选定“显示公式”和“显
文档评论(0)