医疗统计学多元逐步回归二零一八.ppt

医疗统计学多元逐步回归二零一八.ppt

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

医疗统计学多元逐步回归二零一八

多重线性回归中自变量确实定:依据理论知识依据经验部分自变量作用不确认,借助统计分析来实现剔除:对问题研究可能不主要可能实际上与其它变量重合较大测量误差逐步回归医疗统计学多元逐步回归二零一八2/29

为何要剔除一部分自变量?自变量太多,信息成本高,模型复杂,不易分析了解高度相关自变量并不增强模型预测能力,反而加大回归系数样本变差,减弱模型描述能力少而精医疗统计学多元逐步回归二零一八3/29

逐步回归逐步回归------从m个自变量中选择K(K≤m)个自变量,拟合最优或较理想多元线性回归方程。选出自变量数应:足够少:对应变量无主要作用自变量不能多,剔除在方程外充分多:对应变量有主要作用自变量不能少,保留在方程中医疗统计学多元逐步回归二零一八4/29

自变量选择准则残差平方和(SS残)与确定系数(R2)残差均方(MS残)与调整确定系数(AdjR2)AIC信息统计量CP统计量医疗统计学多元逐步回归二零一八5/29

残差平方和(SS残)以某一自变量Xj被引入模型中造成残差平方和改变量评价在此模型条件下Xj对应变量影响程度;引入Xj,SS残降低许多,则Xj对Y作用大,可被引入剔除Xj,SS残增加量多,则Xj对Y作用大,不应剔除医疗统计学多元逐步回归二零一八6/29

确定系数(R2)R2=1-SS残/SS总R2与SS残完全相关,作为选择自变量准则时完全与SS残等价。医疗统计学多元逐步回归二零一八7/29

SS残与R2如含有p个自变量某一个组合可使:SS残P与含全部(m个)自变量SS残m靠近;R2P与R2m靠近则含这p个自变量方程为“最优”方程但“靠近”标准凭主观确定医疗统计学多元逐步回归二零一八8/29

SS残与R2SS残、R2值大小与引入自变量个数相关,随自变量个数增加SS残降低医疗统计学多元逐步回归二零一八9/29

SS残与R2SS残值小,R2大缺点:按SS残值小,R2大标准选择自变量,全部自变量均引入时模型为较“优”模型,未起到选择自变量作用;SS残改变量准则适合用于比较含有相同自变量个数模型优劣判据,而不适合对变量个数不一样模型比较。医疗统计学多元逐步回归二零一八10/29

残差均方(MS残)模型从无自变量开始,按自变量对Y作用大小逐步引入,当对Y作用大自变量引入时,SS残降低幅度大于(n-p-1)降低幅度,MS残降低;当模型中自变量增加到一定程度,对Y作用大自变量已基本引入,再增加自变量,SS残降低幅度小于(n-p-1)降低幅度,MS残增加。医疗统计学多元逐步回归二零一八11/29

调整确定系数(AdjR2)作为选择自变量准则,AdjR2与MS残等价。缺点:n很大,AdjR2≈R2,评判效果不佳医疗统计学多元逐步回归二零一八12/29

AIC信息统计量由日本统计学家Akaike(1974)提出并修正以适合于回归模型选择准则------Akaike信息量准则(Akaikeinformationcriterion),简记AIC。最小二乘法下AIC=n.Ln(SS残P)+2PSS残P:含P个自变量时残差平方和。AIC到达最小为准则医疗统计学多元逐步回归二零一八13/29

CP统计量Mallows,C.L(1966)提出。:含有P个自变量残差平方和;:含有全部自变量(m个)残差平方和医疗统计学多元逐步回归二零一八14/29

CP统计量CP统计量从预测出发,基于残差平方和一个准则。若含有P个自变量模型适当,含有较小CP值,且CP靠近于P+1模型为“最优”模型。n大时,CP准则效果好医疗统计学多元逐步回归二零一八15/29

自变量选择方法“目标”决定自变量选择方法选择对应变量作最好预报一组自变量----着眼点是拟合回归方程一组自变量整体,用该组自变量应使回归方程拟合得最好;选择对应变量作最好解释主要自变量----着眼点是引入回归方程一组自变量每个自变量医疗统计学多元逐步回归二零一八16/29

自变量选择方法最优子集法向前法向后法逐步法医疗统计学多元逐步回归二零一八17/29

最优子集法m个自变量,可建立2m-1个不一样自变量组合方程,按某一自变量选择准则,从2m-1个方程中选择一个或几个最优方程。惯用自变量选择准则:SS残准则、R2准则、AdjR2准则、CP准则提议选择:AdjR2准则、CP准则医疗统计学多元逐步回归二零一八18/29

最优子集法优点:MS残最小,F最大,回归方程最优;缺点:计算量大,如

您可能关注的文档

文档评论(0)

139****3710 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档