- 1、本文档共130页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 7 章相关与回归分析 本章主要内容 7.1 相关与回归的基本问题 7.2 相关分析 7.3 一元线性回归分析 7.4 多元线性回归分析 学习目标 1.函数关系与相关关系 2.相关系数的分析方法(运用EXCEL计算相关系数) 3.线性回归的基本原理和参数的最小二乘估计 4.回归直线的拟合优度及回归方程的显著性检验 5.利用回归方程进行估计和预测 6.用 Excel 进行回归 变量间的关系 函数关系 是一一对应的确定关系 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 各观测点落在一条线上 函数关系(几个例子) 相关关系(correlation) 变量间关系不能用函数关系精确表达 一个变量的取值不能由另一个变量唯一确定 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在直线周围 相关关系(几个例子) 相关关系的种类 1.按相关的程度分: 散点图(scatter diagram) 散点图(例题分析) 【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的增长,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行某年的有关业务数据 散点图(例题分析) 散点图(例题分析) 相关关系的描述与测度(相关系数) 相关系数(correlation coefficient) 对变量之间关系密切程度的度量 对两个变量之间线性相关程度的度量称为简单相关系数 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为? 若是根据样本数据计算的,则称为样本相关系数,记为 r 相关系数 (计算公式) ? 样本相关系数的计算公式 相关系数(取值及其意义) r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 r = 0,不存在线性相关关系 -1?r0,为负相关 0r?1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 相关系数(取值及其意义) 散点图(运用EXCEL进行实际操作) 相关系数的显著性检验 相关系数显著性检验的原因 由于总体的相关系数(?)一般情况下是未知的,通常是根据样本系数( r)来估计. r是根据样本数据计算出来的,受到抽样的影响(抽取的样本不同, r的计算结果就不同.)因此r是个随即变量. 能否根据样本的相关系数说明总体的相关程度就需要进行显著性检验. 相关系数的显著性检验( r 的抽样分布) 1. r 的抽样分布随总体相关系数(?)和样本容量( n)的大小而变化 当样本数据来自正态总体时,随着n的增大,r 的抽样 分布趋于正态分布,尤其是在总体相关系数?很小或接 近0时,趋于正态分布的趋势非常明显。而当?远离0 时,除非n非常大,否则r的抽样分布呈现一定的偏态。 当?为较大的正值时,r 呈现左偏分布;当?为较小的负值时,r 呈现右偏分布。只有当?接近于0,而样本容量n很大时,才能认为r是接近于正态分布的随机变量(因此正态检验有风险,用费希尔的t 分布检验,可以适用于大小样本) 相关系数的显著性检验(检验的步骤) 1. 检验两个变量之间是否存在线性相关关系 等价于对回归系数 b的检验 采用R.A.Fisher提出的 t 检验 检验的步骤为 提出假设:H0:? ? ? ;H1: ? ? 0 相关系数的显著性检验(例题分析) ? 对不良贷款与贷款余额之间的相关系数进行显著性检(??0.05) 提出假设:H0:? ? ? ;H1: ? ? 0 计算检验的统计量 相关系数的显著性检验(例题分析) 各相关系数检验的统计量 什么是回归分析?(Regression) 从一组样本数据出发,确定变量之间的数学关系式 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度 回归分析与相关分析的区别 相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变
文档评论(0)