第6.3多元回归..ppt

下载文档

2
0
约 30页
2017-05-29 发布于北京
举报
版权申诉
保障服务

第6.3多元回归..ppt

1、本文档共30页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

世界上所有的模型都只是对现实世界的某种近似。没有完美的模型。所有的模型都命中注定要被修正、改进以至于被替代。吴喜之 6.3 多元线性回归统计应用预测大学足球比赛的获胜得分差额为检验一场大学足球比赛中“争球码数”、“传球码数”、“回传次数”、“控球时间”以及“主场优势”等变量对比赛最后得分的影响，分析人员建立了一个多元回归模型。该模型的因变量是“比赛获胜得分的差值”，它等于胜方的最后得分减去负方的最后得分从高校体育协会前20名球队的比赛中随机抽取了90场，收集到自变量和因变量的数据，并进行多元回归分析，得到的回归结果如表 6.3.1　多元回归模型及假定多元回归模型 (multiple regression model) 一个因变量与两个及两个以上自变量的回归描述因变量 y 如何依赖于自变量 x1 ， x2 ，…， xk 和误差项 ? 的方程，称为多元回归模型涉及 k 个自变量的多元回归模型可表示为多元回归模型(基本假定) 误差项ε是一个期望值为0的随机变量，即E(?)=0 对于自变量x1，x2，…，xk的所有值，?的方差? 2都相同误差项ε是一个服从正态分布的随机变量，即ε~N(0,?2)，且相互独立多元回归方程 (multiple regression equation) 描述因变量 y 的平均值或期望值如何依赖于自变量 x1， x2 ，…，xk的方程多元线性回归方程的形式为 E( y ) = ?0+ ?1 x1 + ?2 x2 +…+ ?k xk 二元回归方程的直观解释 6.3.2　多元回归模型的估计多元回归模型的估计(estimated multiple regression equation) 用样本统计量估计回归模型中的参数由最小二乘法求得一般形式为参数的最小二乘法 6.3.3　多元回归模型的检验一、多重可决系数(拟合优度检验) 回归平方和占总平方和的比例计算公式为因变量取值的变差中，能被估计的多元回归方程所解释的比例修正多重可决系数(adjusted multiple coefficient of determination) 用样本量n和自变量的个数k去修正R2得到计算公式为避免增加自变量而高估 R2 意义与 R2类似数值小于R2 二、回归系数的检验线性关系检验通过后，对各个回归系数有选择地进行一次或多次检验究竟要对哪几个回归系数进行检验，通常需要在建立模型之前作出决定对回归系数检验的个数进行限制，以避免犯过多的第Ⅰ类错误(弃真错误) 对每一个自变量都要单独进行检验应用 t 检验统计量回归系数的检验(步骤) 提出假设 H0： bi = 0 (自变量 xi 与因变量 y 没有线性关系) H1： bi ? 0 (自变量 xi 与因变量 y有线性关系) 计算检验的统计量 t 回归系数的推断 (置信区间) ?回归系数在1-?置信水平下的置信区间为三、线性关系检验检验因变量与所有自变量之间的线性关系是否显著也被称为总体的显著性检验检验方法是将回归均方(MSR)同残差均方(MSE)加以比较，应用 F 检验来分析二者之间的差别是否显著如果是显著的，因变量与自变量之间存在线性关系如果不显著，因变量与自变量之间不存在线性关系线性关系检验提出假设 H0：?1??2????k=0 线性关系不显著 H1：?1，?2，? ?k至少有一个不等于0 变量选择过程在建立回归模型时，对自变量进行筛选选择自变量的原则是对统计量进行显著性检验将一个或一个以上的自变量引入到回归模型中时，是否使得残差平方和(SSE)有显著减少。如果增加一个自变量使SSE的减少是显著的，则说明有必要将这个自变量引入回归模型，否则，就没有必要将这个自变量引入回归模型确定引入自变量是否使SSE有显著减少的方法，就是使用F统计量的值作为一个标准，以此来确定是在模型中增加一个自变量，还是从模型中剔除一个自变量变量选择的方法主要有：向前选择、向后剔除、逐步回归、最优子集等向前选择 (forward selection) 从模型中没有自变量开始对k个自变量分别拟合对因变量的一元线性回归模型，共有k个，然后找出F统计量的值最高的模型及其自变量，并将其首先引入模型分别拟合引入模型外的k-1个自变量的线性回归模型如此反复进行，直至模型外的自变量均无统计显著性为止向后剔除 (backward elimination) 先对因变量拟合包