- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
多元逐步回归多元线性回归中自变量的确定:?根据理论知识与经验决定自变量,由于对部分自变量的作用不确认,借助统计分析来实现,剔除:(1)对问题的研究可能不重要;(2)可能实际上与其他变量重叠;(3)较大测量误差。
为何要剔除一部分自变量?自变量太多,信息成本高,模型复杂,不易分析理解;?高度相关的自变量并不增强模型的预测能力,反而加大回归系数的样本变差,削弱模型的描述能力。
多元逐步回归?多元逐步回归------从m个自变量中选择K(K≤m)个自变量,拟合最优或较理想的多元线性回归方程。选出的自变量数应:?足够少:对应变量无重要作用的自变量不能多,剔除在方程外?充分多:对应变量有重要作用的自变量不能少,保留在方程中
自变量选择准则?残差平方和(SS)与确定系数(R)残2?残差均方(MS)与调整确定系数(AdjR)残2?AIC信息统计量?C统计量P?预测残差平方和PRESS
残差平方和(SS残)?残差平方和(SS)与确定系数(R)2残以某一自变量Xj被引入模型中导致残差平方和的改变量评价在此模型条件下Xj对应变量影响程度;引入Xj,SS减少量多,则Xj对Y的作用大,残可被引入;剔除Xj,SS增加量多,则Xj对Y的作用大,残不应剔除.
确定系数(R)2?R=1-SS/SS2残总R与SS完全相关,作为选择自变量的准2残则时完全与SS等价。残
SS与R2残?如具有p个自变量的某一种组合可使:SS与含全部(m个)自变量SS接近;残P残mR2P与R2m接近,则含这p个自变量的方程为“最优”方程。但“接近”的标准凭主观确定
SS与R2残SS值小,R2大的模型为较“优”模型。值的大小与引入自变量个数有关,随自变量个数的增加SS减少,R残SSR2残、2残缺点:按SS值小,R大的原则选择自变量,全部自2残变量均引入时的模型为较“优”模型,未起到选择自变量作用;SS变化量准则适用于比较具有相同自变量个残数模型优劣的判据,而不适合对变量个数不同的模型的比较。
残差均方(MS残)?MS=SS/(n-p-1):残P残P含P个自变量时的MS残?MS是在SS准则基础上增加了(n-p-1)-1因残残子,随着自变量个数的增加,SS减少,残(n-p-1)同时减少,MS不一定减低。残
残差均方(MS残)?模型从无自变量开始,按自变量对Y作用大小逐渐引入,当对Y作用大的自变量引入时,SS减少幅度大于(n-p-1)减少幅度,MS残残降低;?当模型中自变量增加到一定程度,对Y作用大的自变量已基本引入,再增加自变量,SS减少幅度小于(n-p-1)减少幅度,MS残残增加。
调整确定系数(AdjR)2?作为选择自变量的准则,AdjR等价。2与MS残?缺点:当n很大,AdjR≈R2,评判效果不佳2
AIC信息统计量?由日本统计学家Akaike(1974)提出并修正以适合于回归模型选择的准则------Akaike信息量准则(Akaikeinformationcriterion),简记AIC。?AIC实用计算式AIC=n.Ln(SS)+2P残PSS:含P个自变量时的残差平方和。残PAIC达到最小为准则
C统计量P?Mallows,C.L(1966)提出。??:含有P个自变量的残差平方和;?:含有全部自变量(m个)的残差平方和
C统计量P?C统计量从预测出发,基于残差平方和的一个准则。P?若含有P个自变量的模型合适,?具有较小的C值,且C接近于P+1的模型为“最优”模型。PP?n大时,C准则效果好P
预测残差平方和PRESS?h度量第i个数据点到数据中心的距离ii?当PRESS达到最小的自变量组合模型为“最优”模型
自变量选择方法目的决定自变量选择方法?选择对应变量作最好预报的一组自变量----着眼点是拟合回归方程的一组自变量整体,用该组自变量应使回归方程拟合得最好;?选择对应变量作最好解释的主要自变量----着眼点是引入回归方程的一组自变量的每个自变量
自变量选择方法?最优子集法?向前法?向后法?逐步法
最优子集法?m个自变量,可建立2m-1个不同自变量组合方程,按某一自变量选择准则,从2程。m-1个方程中选择一个或几个最优的方?常用自变量选择准则:SS准则、R准则、2残AdjR2准则、C准则?建议选择:AdjRP2准则、C准则P
最优子集法?优点MS最小,F最大,回归方程最优;残?缺点:计算量大,如m=15,则必须拟合215-1=32767个子集回归方程来挑选最优,因此该法主要适用于m较小情况当样本含量n小时,结果的重复性差;不能保证:
您可能关注的文档
- 2024年六安市特种设备监督检验中心招聘2人历年【高频考点汇总500题】模拟卷及参考答案详解.docx
- 2024年六安皖西卫生职业学院附属医院(六安市第二人民医院)高层次人才引进【高频考点汇总500题】模拟卷及参考答案详解.docx
- 2024年六盘水市六枝特区引进急需紧缺人才历年【高频考点汇总500题】模拟卷及参考答案详解.docx
- 2024年兰陵文化旅游发展限公司五家权属子公司面向社会公开招聘工作人员24名【高频考点汇总500题】模拟卷及参考答案详解.docx
- 2024年共青团柳州市委员会招募2人(广西)【高频考点汇总500题】模拟卷及参考答案详解.docx
- 2024年兵器工业集团创新院校园招聘【高频考点汇总500题】模拟卷及参考答案详解.docx
- 2024年内江市交通运输局开发区分局招考聘用2人【高频考点汇总500题】模拟卷及参考答案详解.docx
- 2024年内江市第二人民医院招考聘用专业技术人员25人【高频考点汇总500题】模拟卷及参考答案详解.docx
- 多年生草本花卉宿根花卉课件.ppt
- 2024年内江资中县事业单位考聘工作人员(307名)历年【高频考点汇总500题】模拟卷及参考答案详解.docx
文档评论(0)