网站大量收购独家精品文档,联系QQ:2885784924

CH5-1,5-2一元线性回归讲解.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
CH5-1,5-2一元线性回归讲解

变元X与Y的样本相关系数: 变元X与Y的相关系数r的性质: 利差分解公式:总离差平方和=回归平方和+残差平方和 注: 判定系数: 注: 说明: 反映了回归中自变量变差的贡献 反映了其它因素的影响 解: 关于上述例1,请大家思考如下问题: 我们得到的回归方程有什么用? 根据哪些指标可以判断回归的效果?上述回归的效果如何? 上例中:年龄为自变量(控制变量),体重为因变量(响应变量),回 归方程为: y = 7.83+2.01x , 那么据此方程得: x = (y -7.83)/2.01 ,它 可否视为把体重作为自变量,年龄作为因变量的回归方程? 对于任意给定的一组数值(xi, yi) i=1,2,…,n,比如 xi 表示第i天的最高 气温, yi表示第i天股市的收盘指数,是否都可以像例1一样代入参数的公 式并求出回归方程? 如果观测值较多,直接手算比较复杂,如何借助计算机求解回归方程? 关于问题1:回归方程有什么用途? 回归方程的主要用途是预测和控制,比如根据上例的回归方程 y = 7.83+2.01x ,我们可以预测 x=2.2(岁)时儿童的体重为: y = 7.83+2.01*2.2=12.252(kg)-----这是y的点估计,我们还可 以得到y的区间估计。 对于一元线性回归模型 ,其中误差项满足正态性,独立性,及 方差齐性的条件 , 给定 ,则对应 的点估计为 ;当 n 充分 大时, 置信水平为 此外,我们还可以求出参数 关于问题2: 哪些指标可以判断回归的效果? 如下指标都可以直接或间接用来表示回归的效果: 参差平方和 SSe 估计标准差 相关系数 r 判定系数 修正判定系数 其中p为自变元个数 从例1第二问的结果看,该例回归的效果还是很好的 关于问题3: 能否由体重关于年龄的回归方程: y = 7.83+2.01x , 得出年龄关于体重的回归方程: x = (y -7.83)/2.01=0.4975y – 3.8955 ? 不可以。事实上,如果把体重作为自变量年龄作为因变量, 代入一元回归的公式,得:x = 0.4939y – 3.853; 二者为何不同呢? 因为经典回归中,自变量与响应变量的地位是不等同的 而对距离回归,即通过各散点到回归函数的距离平方和最小来求出回归参数,此时 自变量与响应变量的地位是等同的,这种情况下是可以直接从 y关于 x 的回归方程 解出 x 关于 y 的回归方程的 关于问题4: 对于任意给定的一组数值(xi, yi) i=1,2,…,n, 是否都可以求变量的回归方程? 可以代入参数最小二乘估计的公式求出变元的回归方程,但是,如果变元 X 和 Y 没有统计相关关系,这样求出的回归方程是没有意义的(如气温与股票点数);而如果回归模型的三个条件,即正态性,独立性,方差齐性 不满足,我们就无法对参数的概率特性(分布,区间估计 等)作出判断。 直观地说,如果根据变元 X 和 Y 的观测值算出的相关系数的绝对值越大(越接近1),即表示变元 X 和 Y 线性关系越强,这时拟合观测值(xi, yi)的回归方程越有意义 那么,相关系数的绝对值要达到多大才可以求回归方程呢? 在统计上,我们是用假设检验的方法来判定变元的线性关系是否显著,因为检验的统 计量服从F分布,因此这个检验叫F检验 关于问题5: 如何借助计算机算法进行回归分析? 各种统计软件都有回归分析的功能,比如SAS,SPSS,R,包 括MATLAB的统计包 等,这里我们介绍EXCEL的回归分析功能 操作步骤(多元回归同样操作,但利用EXCEL多元回归分析时自变元个数不能超过16个): 1)把数据输入EXCEL表 2)点工具菜单 ? 加载宏 ? 数据分析 ? 回归 对例1中数据的EXCEL回归分析结果: 复相关系数 判定系数 修正判定系数 估计标准差 F统计量观测值 F检验的P值,当P值小于给定显著性水平时,说明变元线性关系显著 P值小于显著性水平时说明常数项显著性非零 P值小于显著性水平时说明x系数显著性非零 回归参数置信区间的上下限 例2:恩格尔系数(食品支出与收入之比)的

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档