- 1、本文档共62页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
三、分析步骤*2.4.3逐步回归法逐步回归法有无符合纳入标准的新变量纳入新变量有无符合排除标准的变量踢除完成无有无有三、分析步骤*逐步回归法比前进法和后退法都能更好地选出变量构造模型,但它也有局限性:其一,当有m个变量入选后,选第m+1个变量时,对它来说,前m个变量不一定是最佳组合;其二,选入或踢除自变量仅以F值和P值作标准,完全没考虑其它标准。三、分析步骤2.4.4变量筛选方法的选择*究竟哪一种筛选变量的方法最好?这个问题没有绝对的定论。一般来说,逐步回归法和最优回归子集法较好。对于一个给定的资料,可试用多种变量筛选的方法,结合以下几条判断原则,从中选择最佳者。三、分析步骤*其一,拟合的回归方程在整体上有统计学意义;其二,回归方程中各回归参数的估计值的假设检验结果都有统计学意义;其三,回归方程中各回归参数的估计值的正负号与其后的变量在专业上的含义相吻合;其四,根据回归方程计算出因变量的所有预测值在专业上都有意义。其五,若有多个较好的多重线性回归方程时,残差平方和较小且多重线性回归方程中所含的自变量的个数又较少者为最佳。三、分析步骤*模型拟合效果评价01决定系数(R2)即复(全)相关系数的平方,其值等于因变量观测值与预测值之间简单相关系数的平方。计算公式为:02三、分析步骤*模型拟合效果评价决定系数(R2)R2取值介于0到1之间,其含义为自变量能够解释因变量y变异的百分比。R2越接近于1,说明线性回归对实际数据的拟合程度越好。三、分析步骤*模型拟合效果评价校正决定系数(Rc2)随着模型中自变量个数的增加,决定系数R2将不断增大,这不符合回归模型中自变量个数尽可能少的原则。三、分析步骤*模型拟合效果评价校正决定系数(Rc2)故在评价两个包含不同个数自变量的回归模型的拟合效果时,不能简单地用决定系数作为评价标准。此时,必须考虑回归模型中自变量个数的影响。三、分析步骤*模型拟合效果评价校正决定系数(Rc2)构造校正决定系数,其公式为:其中,n为样本含量,p为模型中自变量个数。决定系数相同时,自变量个数越多,Rc2越小。0102三、分析步骤*模型拟合效果评价AIC信息准则该准则由日本学者赤池于1973年提出,广泛应用于时间序列分析中自回归阶数的确定,多重回归、广义线性回归中自变量的筛选以及非线性回归模型的比较和选优。该统计量取值越小,反映模型拟合效果越好。0102当自变量均为随机变量时,若它们之间高度相关,则称变量间存在多重共线性(multicollinearity);自变量之间不存在多重共线性,即称其互相独立。在进行多重线性回归分析时,除了要满足LINE外,还要求各变量之间不能存在共线性,即各变量之间要相互独立。为此,需要进行共线性诊断;0201三、分析步骤2.6共线性诊断三、分析步骤*多重线性回归分析中,可能会出现以下问题:回归方程的检验有统计学意义,而各偏回归系数的检验均无统计学意义。偏回归系数的估计值大小或其符号与实际情况和专业知识相违背,难以解释。某个(些)与因变量关系密切的自变量,因为参数标准误的估计值较大,相应t值就会变得较小,造成其偏回归系数无统计学意义。三、分析步骤导致这些问题的原因可能有:*研究设计不够合理;资料收集存在问题;自变量间近似线性;样本少而自变量多。数据中存在异常点;0102030405三、分析步骤*何谓多重共线性?1自变量间的近似线性关系,即是多重共线性。2由于数据自身的特征,回归模型中的自变量之间或多或少地存在一些相关性,这违反了自变量间相互独立的假设条件,称为多重共线性。3三、分析步骤*多重共线性的分类:严重的多重共线性此时,自变量之间存在着较高甚至完全的线性相关关系,虽然最小二乘法仍可应用,但由于观测误差的稳定性变差,所得的估计值可能面目全非。这类情况较为少见。某种程度的多重共线性此时,最小二乘法仍可获得参数的无偏估计值,但参数的方差估计值将变得很大,导致估计精度下降,且无法判断自变量对因变量的影响程度。例研究胎儿受精龄Y/周与胎儿身长X1/cm、头围X2/cm,体重X3/g之间的依存关系。显然,此处的3个解释变量X1、X2、X3之间存在着高度的共线性,X1、X2、X3两项对Y的过分贡献只能用X2项的负系数抵消,造成其专业意义无法解释而出现悖论。三、分析步骤相关系数Correlation方差膨胀因子VIF方差比例Variancepropor
文档评论(0)