简明应用统计学--多元回归分析.pptx

下载文档

29
0
约5.71千字
约 60页
2020-05-30 发布于湖北
举报
版权申诉
保障服务

简明应用统计学--多元回归分析.pptx

1、本文档共60页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

简明应用统计学--多元回归分析;;9.1 基本模型 9.2 多元线性回归实例：参数估计、显著性检验、利用回归方程估计和预测 9.3 定性自变量 9.4 非线性回归 9.5 回归分析中可能存在的建模陷阱;1. 能对多元线性回归模型进行参数估计和有关假设检验。 2. 了解含定性自变量的回归模型。 3. 了解非线性回归。 4.了解回归建模当中可能存在的一些陷阱。 5. 相关理论在统计软件中的应用。 6. 相应统计分析结果的解读。;多元回归模型(multiple regression model)是一个因变量与两个及两个以上自变量的回归模型。描述因变量 y 如何依赖于自变量 x1 ， x2 ，…， xk 和误差项 ?。;当因变量与各自变量之间为线性关系时，称为多元线性回归模型(multiple linear regression model)。涉及 k 个自变量的多元线性回归模型可表示为;误差项ε是一个期望值为0的随机变量，即E(?)=0。对于自变量x1，x2，…，xk的所有值，?的方差? 2都相同。误差项ε是一个服从正态分布的随机变量，即ε~N(0,?2)，且相互独立。;二元回归方程的直观解释;用样本统计量估计回归方程中的参数时得到的方程由最小二乘法求得一般形式为;多元线性回归的矩阵表达式;与一元线性回归一样,我们采用最小二乘法估计β0,β1,β2,…,βk。在一定的假定下,最小二乘估计有很多优良的性质。在β0,β1,…,βk的所有线性无偏估计中,最小二乘估计方差最小,因此称之为参数的最佳线性无偏估计(best linear unbiased estimator,BLUE)。 ;求解各回归参数的标准方程如下;(1)与一元回归不同,在多元回归中我们更常用修正的R2来描述方程的拟合优度。因为当变量数目增加时,判定系数R2有增大的缺点。因此,人们采用修正的R2(adjusted R square) 用样本量n和自变量的个数k去修正R2得到避免增加自变量而高估 R2 意义与 R2类似数值小于R2　;(2)在多元回归中F检验和t检验不再等价。对于多元回归模型,这时F检验的假设为 H0：?1??2????k=0 线性关系不显著 H1：?1，?2，? ?k至少有一个不等于0 ;我们通过一个实例来介绍多元线性回归模型的建模过程，包括探索性分析、参数估计、模型检验等等。　　;9.2 多元??性回归实例;1、探索性分析：散点图;1、探索性分析：相关矩阵;2、参数估计;3、回归方程的拟合优度;4、显著性检验;检验因变量与所有自变量之间的线性关系是否显著也被称为总体的显著性检验检验方法是将回归均方(MSR)同残差均方(MSE)加以比较，应用 F 检验来分析二者之间的差别是否显著如果是显著的，因变量与自变量之间存在线性关系如果不显著，因变量与自变量之间不存在线性关系;提出假设 H0：?1??2????k=0 线性关系不显著 H1：?1，?2，? ?k至少有一个不等于0 ;对于例9.1,我们将检验自变量(沟通能力X1,乐观积极X2和学业成功X3)是否能够有效地估计有意义的大学生活。假设检验问题为: H0:β1=β2=β3=0?H1:不是所有的β值都为0 ;线性关系检验通过后，对各个回归系数有选择地进行一次或多次检验究竟要对哪几个回归系数进行检验，通常需要在建立模型之前作出决定对回归系数检验的个数进行限制，以避免犯过多的第Ⅰ类错误(弃真错误) 对每一个自变量都要单独进行检验应用 t 检验统计量;提出假设 H0： bi = 0 (自变量 xi 与因变量 y 没有线性关系) H1： bi ? 0 (自变量 xi 与因变量 y有线性关系) 计算检验的t统计量;回归系数在(1-?)%置信水平下的置信区间为 ;以例9.1来描述t检验。假设检验问题如下: 　　对沟通能力:H0:β1=0?H1:β1≠0 　　对乐观积极:H0:β2=0?H1:β2≠0 　　对学业成功:H0:β3=0?H1:β3≠0 ;注意到这一模型的常数项也是统计不显著的,t值为-0.238,p-值为0.814。尽管如此,常数项仍应保留在模型中,除非有非常明确的理由才能剔除它,因为常数项反映了因变量的基准水平。一般来说,不显著的自变量应从模型中剔除,但是常数项却