统计学第六版贾俊平第11章节.ppt

  1. 1、本文档共94页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学第六版贾俊平第11章节

第七章 一元线性回归 11.1 变量间关系的度量 11.2 一元线性回归 11.3 利用回归方程进行估计和预测 11.4 残差分析 学习目标 1. 相关系数的分析方法 一元线性回归的基本原理和参数的最小二乘估计 回归直线的拟合优度 回归方程的显著性检验 利用回归方程进行估计和预测 用 Excel 进行回归 变量间的关系 函数关系 是一一对应的确定关系 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 各观测点落在一条线上 函数关系 (几个例子) 相关关系 (correlation) 变量间关系不能用函数关系精确表达 一个变量的取值不能由另一个变量唯一确定 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在直线周围 相关关系 (几个例子) 相关关系 (类型) 相关关系的描述与测度 (散点图) 散点图 (scatter diagram) 散点图 (例题分析) 【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据 散点图 (例题分析) 散点图 (例题分析) 相关关系的描述与测度 (相关系数) 相关系数 (correlation coefficient) 对变量之间关系密切程度的度量 对两个变量之间线性相关程度的度量称为简单相关系数 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为? 若是根据样本数据计算的,则称为样本相关系数,记为 r 相关系数 (计算公式) ? 样本相关系数的计算公式 相关系数 (取值及其意义) r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 r = 0,不存在线性相关关系相关 -1?r0,为负相关 0r?1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 相关系数 (取值及其意义) 相关系数 (例题分析) 用Excel计算相关系数 相关系数的显著性检验 相关系数的显著性检验 ( r 的抽样分布) 1. r 的抽样分布随总体相关系数和样本容量的大小而变化 当样本数据来自正态总体时,随着n的增大,r 的抽样分布趋于正态分布,尤其是在总体相关系?数很小或接近0时,趋于正态分布的趋势非常明显。而当远离0时,除非n非常大,否则r的抽样分布呈现一定的偏态。 当?为较大的正值时,r 呈现左偏分布;当?为较大的负值时,r 呈现右偏分布。只有当?接近于0,而样本容量n很大时,才能认为r是接近于正态分布的随机变量 相关系数的显著性检验 (检验的步骤) 1. 检验两个变量之间是否存在线性相关关系 等价于对回归系数 b1的检验 采用R.A.Fisher提出的 t 检验 检验的步骤为 提出假设:H0:? ? ? ;H1: ? ? 0 相关系数的显著性检验 (例题分析) ? 对不良贷款与贷款余额之间的相关系数进行显著性检(??0.05) 提出假设:H0:? ? ? ;H1: ? ? 0 计算检验的统计量 相关系数的显著性检验 (例题分析) 各相关系数检验的统计量 什么是回归分析? (Regression) 从一组样本数据出发,确定变量之间的数学关系式 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度 回归分析与相关分析的区别 相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量 相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 回归模型的类型 一元线性回归模型 一元线性回归 涉及一个自变量的回归 因变量y与自变量x之间为线性关系 被预测或被解释的变量称为因变量(dependent variable),用y表示 用来预测或用来解释因变量的一个或多个

文档评论(0)

1honey + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档