第9章 SPSS 线性回归分析.ppt

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第9章 SPSS 线性回归分析

学习的内容与目标 掌握线性回归分析的主要指标,了解最小二乘法的基本思想 熟练掌握线性回归分析的具体操作,读懂分析结果;掌握计算结果之间的数量关系,写出回归方程,对回归方程进行各种统计检验 了解多元回归分析中自变量筛选的策略,以及对应结果的分析 了解SPSS残差分析和多重共线检测的基本操作,并能分析结果 回归分析和相关分析 1.相关分析 变量性质:都是随机变量且关系对等 分析方法:图表法(散点图)和相关系数 分析目的:判定变量之间相关方向和关系的密切程度 2.回归分析 变量性质:自变量(确定型变量)和因变量(随机变量)的关系且不对等 分析方法:建立回归模型 分析目的:研究变量间数量依存关系 9.1.2如何得到回归线 函数拟合 首先,通过散点图观察变量之间的统计关系,得到对回归线的感性认知,并据之确定最简洁的数学函数(回归模型); 其次,利用样本数据在一定的拟合准则下,估计回归模型中各个参数,得到确定的回归方程; 最后,由于回归参数是在样本数据的基础上得到的,存在随机性。因此需要进行各种检验。 9.2.1一元线性回归模型(只有1个解释变量) 数学模型为: y=β0+β1x+ε 上式表明:y的变化可由两部分解释:第一,由解释变量x的变化引起的y的线性变化部分,即y=β0+β1x;第二,由其他随机因素引起的y的变化部分,即ε。 β0 、β1 都是模型中的未知参数,β0为回归常数,β1为y对x回归系数(即x每变动一个单位所引起的y的平均变动) 。 ε称为随机误差。且满足:E(ε)=0,Var(ε)=σ2 。 一元线性回归方程: E(y)=β0+β1x 表明x和y之间的统计关系是在平均意义下表述的。 估计的一元线性回归方程: 估计方程是平面上的一条直线,即回归直线。 参数分别代表回归直线的截距和斜率。 9.3.1回归方程的拟合优度检验 用于检验样本数据点聚集在回归线周围的密集程度,从而评价回归线对样本数据的代表程度。 思想:因变量y(儿子身高)取值的变化受两个因素的影响:自变量x(父亲身高)不同取值的影响,其他因素(环境、饮食等)的影响。 可表示如下: 因变量总变差 = 自变量引起的 + 其他因素引起的 即因变量总变差= 回归方程可解释的+不可解释的 即,因变量总离差平方和SST =回归平方和 SSA + 剩余平方和SSE 图示: 原假设H0: β1 =0 .即:回归系数与0无显著差异 利用F检验,构造F统计量: F~F(1,n-2) 判断:若 pa,则拒绝H0 ,模型的线性关系是显著的;反之,模型的线性关系不显著. R2检验与F检验的关系 若 pa,拒绝H0,y和x线性关系显著,应保留在方程中; 若 pa,不能拒绝H0, y和x线性关系不显著。 一元线性回归方程的检验和回归系数的检验是等效的。 一、容忍度 解释变量xi 的容忍度:Toli=1-Ri2,其中: Ri2是解释变量xi与方程中其他解释变量间复相关系数的平方,表明了解释变量之间的线性相关程度。 容忍度大表示与其他自变量的共线性低,应进入方程。容忍度很小的变量,spss才会给出警告,不应进入方程 (T0.1一般认为具有多重共线性) 三、特征值与方差比 如果最大特征值远大于其它特征值,表明该解释变量能刻画所有解释变量绝大部分信息(方差),意味着解释变量间存在较强的线性相关关系。 常以某特征值占70%左右。 9.6.2向后筛选策略模型(剔除) 需要对回归系数是否为零逐一进行检验。 原假设H0:βi=0 ,即:第i个偏回归系数与0无显著差异 利用t检验统计量(略) 若与t统计量的概率伴随p a,则拒绝H0 多元线性回归中回归系数的检验与整体回归方程的检验不能相互替代。 二、多元线性方程回归系数的检验 9.3.4残差分析 残差指由回归方程计算所得的预测值与实际样本值之间的差距,即模型中εi 的估计值: 回归模型要求:残差序列中不含明显的规律性和趋势性,均值为零、正态分布、等方差,且序列是独立的。 一、残差均值为零的正态分析 可以通过绘制残差散点图来观察:如果残差的均值为零,残差图中的点应在纵坐标为零的横线上下随机散落,如下图。 二、残差的独立性分析(非自相关) 残差是独立的,则残差序列应满足cov(εi , εj)=0(i≠j),表示残差序列前期和后期之间不存在相关关系,即不存在自相关。独立性检验方式: 第一、绘制残差序列图(下图残差随时间的推移,呈有规律变化,表明残差序列存在一定的正或负自相关) 自相关系数用于测定序列自相关强弱,其取值范围-1~+1,接近1表明序列存在正自相关 第二、计算残差的自相关系数 DW检验用于推断小样本序列是否存在自相关的方法。其原假设为:总

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档