- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
spss学习第四天
SpssSpss学习第四天我主要以课上的顺序来一步步操作一元回归两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,只是在计算上更为复杂,一般需借助计算机来完成。(2)回归方程的显著性检验(F检验)多元线性回归方程的显著性检验一般采用F检验,利用方差分析的方法进行。(3)回归系数的显著性检验(t检验)回归系数的显著性检验是检验各自变量x1,x2,…,对因变量y的影响是否显著,从而找出哪些自变量对y的影响是重要的,哪些是不重要的。与一元线性回归一样,要检验解释变量对因变量y的线性作用是否显著,要使用t检验。课上实例:Next 在这里可以针对不同的自变量设置不同的筛选引入方法。Options 下一步:设置变量引入剔除的标准规则Methot自变量筛选的方法:Enter:所选变量全部引入模型Stepwise:逐步引入法Remove:剔除变量Backward:向后消去法Forward:向前消去法结果:第一个表格是描述统计量第二个表格是相关系数矩阵第三个表格是列出模型引入以及剔除的变量,这里是强制引入法,所有变量引入模型第四个表格是模型拟合优度统计量第五个表格是模型显著性F检验第六个表格是每个回归系数显著性的t检验第七个表格是共线性诊断特征根有些接近0,有个别值特别大有严重共线性。条件指数如有个别维度值大于30,也说明有严重共线性!第八个表格是关于残差的描述统计量第九个表格是残差的正态性诊断多元回归虚拟变量前面几节所讨论的回归模型中,因变量和自变量都是可以直接用数字计量的,即可以获得其实际观测值(如收入、支出、产量、国内生产总值等),这类变量称作数值型变量。然而,在实际问题的研究中,经常会碰到一些非数值型的变量,如性别、民族、职业、文化程度、地区、正常年份与干旱年份、改革前与改革后等定性变量。在回归分析中,对一些自变量是定性变量的先作数量化处理,处理的方法是引进只取“0”和“1”两个值的0?1型虚拟(dummy)自变量。当某一属性出现时,虚拟变量取值为“1”,否则取值为“0”。例如,令“1”表示改革开放以后的时期,“0”则表示改革开放以前的时期。再如,用“l”表示某人是男性,“0”则表示某人是女性。虚拟变量也称为哑变量。需要指出的是,虽然虚拟变量取某一数值,但这一数值没有任何数量大小的意义,它仅仅用来说明观察单位的性质和属性。课上实列:建立虚拟变量DU。设置逻辑运算,如果AREA==1时,DU=1,否则DU=0.结果:逻辑回归称为logistic模型(逻辑回归模型)。我们的逻辑回归模型得到的只是关于P{Y=1|x}的预测。但是,我们可以根据模型给出的Y=1的概率(可能性)的大小来判断预测Y的取值。一般,以0.5为界限,预测p大于0.5时,我们判断此时Y更可能为1,否则认为Y=0。如果该p值小于给定的显著性水平(如=0.05),则拒绝因变量的观测值与模型预测值不存在差异的零假设,表明模型的预测值与观测值存在显著差异。如果值大于,我们没有充分的理由拒绝零假设,表明在可接受的水平上模型的估计拟合了数据课上实例:将因变量放入dependent栏,自变量放入covariates栏中可以把几个变量的乘积作为自变量引入模型作为交互影响项线性回归一样,我们可以通过next按钮把自变量分成不同的组块,使不同的组块按顺序以不同的方式分步进入模型Classification plots:制作分类图,通过比较因变量的观测值与预测值的关系,反映回归模型的拟合效果。Hosmer-Lemeshow goodness-of-fit: H-L检验。Casewise listing of residuals:显示个案的残差值(显示标准化残差超过两倍标准方差的个案或显示所有个案)Correlations of estimates:输出模型中各参数估计的相关矩阵。Iteration history:输出最大似然估计迭代过程中的系数以及log似然值。CI for exp(B):输出exp(beta)的置信区间,默认置信度为95%在save选项中,我们可以选择需要保存的数据文件中的统计量。包括残差值、个案影响度统计量、预测概率值等等结果:第一部分有两个表格,第一个表格说明所有个案(28个)都被选入作为回归分析的个案。第二个表格说明初始的因变量值(0,1)已经转换为逻辑回归分析中常用的0、1数值。(2)第二部分(Block 0)输出结果有4个表格。(组块0里只有常数项,没有自变量)(3)Omnibus Tests of Model Coefficients表格列出了模型系数的Omnibus Tests结果。(4)Model Summary
文档评论(0)