- 1、本文档共42页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
回归分析的步骤根据散点图,对强影响点进行判断和对多重共线性进行判断(自变量之间不能有强相关。)最后两幅图是有强影响点。需要判断是否数据出错,出错则删掉。步骤同一元回归补充步骤在statistic勾上Rsquarechange,partandpartialcorrelation(半偏相关和偏相关),conlineraritydiagnostics(共线性判断)Enter:强制进入Backward:反向删除法把需要控制的变量用这种方法强制enter法放入方程Forward:前向选择法Stepwise:逐步回归,最常用自由进入变量用forward、backward和stepwise方法放入方程010305020406分层回归方法*多元线性回归内容基础概念一元线性回归一元回归方程、线性回归条件步骤强影响点判断多元线性回归1、回归方程、线性回归条件2、线性回归步骤3、评价方程的优度4、强影响点判断5、多重共线性的判断基础概念什么是回归?变量间存在相关关系时,也就具备了建立预测关系的基础。在相关变量见建立预测方程式的统计学方法叫做回归分析。在问卷调查中用得多包括线性和非线性、一元和多元回归分析回归一元和多元线性回归的差别在于自变量的个数一元和多元线性回归一元线性回归:在两个变量具有线性关系的基础上,建立预测方程式。用一个变量预测另一个变量。如儿童的身高和体重存在线性相关,当得知身高时,预测被试的体重范围。多元线性回归:多个变量都与一个变量存在相关关系,建立用预测方程式。用多个变量预测某一个变量。例如:儿童的体重和年龄,都与身高存在线性关系,当已知体重和年龄时,对身高进行预测。一元线性回归一元线性回归方程(使用原始数据计算的回归方程)Y是因变量,X是自变量,alpha和beta是待求的参数。β=(δy/δx)*r,称为非标准化回归系数α=μy-βμx标准化回归方程(使用标准化的数据计算的回归方程)ZY=BZxB=(δZy/δZx)*r=1*r=r,称为标准化回归系数两种方程表现形式建立回归方程提出假设的回归模型,确定自变量和因变量。自变量是现实中容易测量的,而因变量是难测量的,如幸福感、自我效能感等估计回归是线性还是非线性,用散点图判断。如果是线性则用线性回归。(必须做)回归方程的有效性检验,测定系数和回归系数回归分析的一般过程一元线性回归的条件1、线性趋势(用散点图检测)2、独立性:因变量y的取值相互独立,残差独立。用durbin-watson计算,值在0-4。如果残差间相互独立,则取值在2附近。D小于2说明相邻误差存在负相关。大于2,说明存在正相关3、正态性:自变量的任何一个线性组合,因变量y都服从正态分布,残差正态(直方图和PP图)。4、方差齐性:自变量的任何一个线性组合,因变量y的方差均相同(把ZPRED放入Y轴,把ZRESID放入X轴做图)强影响点判断(极端值的判断)注意的问题强影响点判断(极端值的判断)Cook’sdistance:当值1,表明是特别大的极端值。leverage值(杠杆值):当值3倍均数,均数为(自变量个数+1)/N画散点图:最后把cook距离值和leverage杠杆值分别作为X和Y轴画散点图,方便判断。强影响点处理判断原因,考虑是否删除一元线性回归例子建立体重和肺活量的回归方程(用练习1的数据)先探索数据,判断是否整态、极端值画散点图(画出散点图后,双击图,右键选addfitlineattotaltool)Analyze-regression-把肺活量放入因变量dependent-体重放入自变量independentStatistics-默认的-residuals-durinwastonsave——distance–勾上Cook’s和leverage值Plots-histogram和normalprobabilityplot勾上-把ZPRED放入Y,把ZRESID放入X轴——OK一元线性回归步骤β=(δy/δx)*r=(0.41989/7.426)*0.881=0.04981α=μy-βμx*53.43=0.441原始回归方程Y=0.0498X+0.441标准化回归方程Zy=0.881Zx回归方程的显著性检验判断因变量Y是独立的回归方程的系数、标准化回归系数、回归系数的显著性检验测定系数值域在[0,1],越接近于1,表明方程的自变量对y的解释能力越强。当变量的关系是线性关系时,R2越大,说明回归方程拟合数据越好,共变越多。决定系数R2
文档评论(0)