网站大量收购闲置独家精品文档,联系QQ:2885784924

一、线性回归分析.ppt

  1. 1、本文档共69页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一、线性回归分析.ppt

一、线性回归分析 线性回归是统计分析方法中最常用的方法之一。如果所研究的现象有若干个影响因素,且这些因素对现象的综合影响是线性的,则可以使用线性回归的方法建立现象 (因变量)与影响因素(自变量)之间的线性函数关系式。 由于多元线性回归的计算量比较大,所以有必要应用统计分析软件实现。 SPSS软件中进行线性回归分析的选择项为Analyze→Regression→Linear。如图所示。 (一)双变量线性回归 某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。试用多元回归方法确定以身高、体重为自变量,体表面积为应变量的回归方程。 1、数据准备 激活数据管理窗口,定义变量名:体表面积为Y,保留3位小数;身高、体重分别为X1、X2,1位小数。输入原始数据,结果如图8.1所示。 2、统计分析 激活Analyze菜单选Regression中的Linear...项,弹出Linear Regression对话框。 选y,点击?钮使之进入Dependent框; 选x1、x2,点击?钮进入Indepentdent(s)框; 在Method处下拉菜单,共有5个选项:Enter(全部入选法)、Stepwise(逐步法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)。 本例选用Enter法,点击OK钮即完成分析。 点击Statistics...钮选择是否作变量的描述性统计、回归方程应变量的可信区间估计等分析; 点击Plots...钮选择是否作变量分布图(本例要求对标准化Y预测值作变量分布图); 点击Save...钮选择对回归分析的有关结果是否作保存(本例要求对根据所确定的回归方程求得的未校正Y预测值和标准化Y预测值作保存); 点击Options...钮选择变量入选与剔除的α、β值和缺失值的处理方法。 3、结果解释 本例要求按所建立的回归方程计算Y预测值和标准化Y预测值(所谓标准化Y预测值是指将根据回归方程求得的Y预测值转化成按均数为0、标准差为1的标准正态分布的Y值)并将计算结果保存入原数据库。 系统将原始的X1、X2值代入方程求Y值预测值(即库中pre_1栏)和标准化Y预测值。 本例还要求对标准化Y预测值作变量分布图,系统将绘制的统计图送向Chart Carousel窗口,双击该窗口可见下图显示结果。 例:为了考察火柴销售量的影响因素,选择煤气户数、卷烟销量、蚊香销量、打火石销量作为影响因素,得数据表。 建立火柴销售量对于相关因素煤气户数、卷烟销量、蚊香销量、打火石销量的线性回归模型,通过对模型的分析,找出合适的线性回归方程。 1、打开数据文件,单击Analyze ? Regression ? Linear打开Linear 对话框如图所示。 Enter(强迫引入法默认选择项) 定义的全部自变量均引入方程; Remove(强迫剔除法) 定义的全部自变量均删除; Forward(向前引入法) 自变量由少到多一个一个引入回归方程,直到不能按检验水准引入新的变量为止。该法的缺点是:当两个变量一起时效果好单独时效果不好,有可能只引入其中一个变量或两个变量都不能引入。 Backward(向后剔除法) 自变量由多到少一个一个从回归方程中剔除,直到不能按检验水准剔除为止。能克服向前引入法的缺点,当两个变量一起时效果好单独时效果不好,该法可将两个变量都引入方程。 Stepwise(逐步引入一剔除法) 将向前引入法和向后剔除法结合起来,在向前引入的每一步之后都要考虑从已引入方程的变量中剔除作用不显著者,直到没有一个自变量能引入方程和没有一个自变量能从方程中剔除为止。缺点同向前引入法,但选中的变量比较精悍。 4、如果需要观察图形,可单击Plots按纽,打开Linear Regression:Plots对话框如图所示。在此对话框中可以选择所需要的图形。 Model Summary(d) 模型综合分析表 方差分析表 回归系数 回归系数表的输出结果Model栏可以看出: 模型1是先将卷烟销量作为自变量进入模型; 模型2将卷烟销量与打火石销量两个自变量进入模型; 模型3是将卷烟、打火石和煤气户数三个自变量进入模型,自变量蚊香销量没有通过检验自动剔除,得回归模型为: 回归系数表的输出结果可以看出,回归系数都通过检验,模型中自变量与因变量的偏相关系数都在0.7以上,说明进入模型的自变量对因变量的影响都比较显著。 由最后两列的容忍度Tolerance和方差膨胀因子VIF的值来看,自变量之间不存在强烈的共线性。 相关系数表 残差统计 共线性诊断表 练习1 15例儿童的血液中血红蛋白(y,g)与钙(x1) 镁(x2) 铁(x3) 锰(x4)及铜(x5)的含量如下图所示用,逐步回归方法筛选对血红蛋白有显著作用

文档评论(0)

docinppt + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档