- 1、本文档共60页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
简明应用统计学--多元回归分析;;9.1 基本模型
9.2 多元线性回归实例:参数估计、显著性检验、利用回归方程估计和预测
9.3 定性自变量
9.4 非线性回归
9.5 回归分析中可能存在的建模陷阱;1. 能对多元线性回归模型进行参数估计和有关假设检验。
2. 了解含定性自变量的回归模型。
3. 了解非线性回归。
4.了解回归建模当中可能存在的一些陷阱。
5. 相关理论在统计软件中的应用。
6. 相应统计分析结果的解读。;多元回归模型(multiple regression model)是
一个因变量与两个及两个以上自变量的回归模型。
描述因变量 y 如何依赖于自变量 x1 , x2 ,…, xk 和误差项 ?。;当因变量与各自变量之间为线性关系时,称为多元线性回归模型(multiple linear regression model)。
涉及 k 个自变量的多元线性回归模型可表示为;误差项ε是一个期望值为0的随机变量,即E(?)=0。
对于自变量x1,x2,…,xk的所有值,?的方差? 2都相同。
误差项ε是一个服从正态分布的随机变量,即ε~N(0,?2),且相互独立。;二元回归方程的直观解释;用样本统计量 估计回归方程中的 参数 时得到的方程
由最小二乘法求得
一般形式为;多元线性回归的矩阵表达式;与一元线性回归一样,我们采用最小二乘法估计β0,β1,β2,…,βk。
在一定的假定下,最小二乘估计有很多优良的性质。在β0,β1,…,βk的所有线性无偏估计中,最小二乘估计方差最小,因此称之为参数的最佳线性无偏估计(best linear unbiased estimator,BLUE)。
;求解各回归参数的标准方程如下;(1)与一元回归不同,在多元回归中我们更常用修正的R2来描述方程的拟合优度。因为当变量数目增加时,判定系数R2有增大的缺点。因此,人们采用修正的R2(adjusted R square)
用样本量n和自变量的个数k去修正R2得到
避免增加自变量而高估 R2
意义与 R2类似
数值小于R2 ;(2)在多元回归中F检验和t检验不再等价。对于多元回归模型,这时F检验的假设为
H0:?1??2????k=0 线性关系不显著
H1:?1,?2,? ?k至少有一个不等于0
;我们通过一个实例来介绍多元线性回归模型的建模过程,包括探索性分析、参数估计、模型检验等等。 ;9.2 多元??性回归实例;1、探索性分析:散点图;1、探索性分析:相关矩阵;2、参数估计;3、回归方程的拟合优度;4、显著性检验;检验因变量与所有自变量之间的线性关系是否显著
也被称为总体的显著性检验
检验方法是将回归均方(MSR)同残差均方(MSE)加以比较,应用 F 检验来分析二者之间的差别是否显著
如果是显著的,因变量与自变量之间存在线性关系
如果不显著,因变量与自变量之间不存在线性关系;提出假设
H0:?1??2????k=0 线性关系不显著
H1:?1,?2,? ?k至少有一个不等于0
;对于例9.1,我们将检验自变量(沟通能力X1,乐观积极X2和学业成功X3)是否能够有效地估计有意义的大学生活。假设检验问题为:
H0:β1=β2=β3=0?H1:不是所有的β值都为0
;线性关系检验通过后,对各个回归系数有选择地进行一次或多次检验
究竟要对哪几个回归系数进行检验,通常需要在建立模型之前作出决定
对回归系数检验的个数进行限制,以避免犯过多的第Ⅰ类错误(弃真错误)
对每一个自变量都要单独进行检验
应用 t 检验统计量;提出假设
H0: bi = 0 (自变量 xi 与 因变量 y 没有线性关系)
H1: bi ? 0 (自变量 xi 与 因变量 y有线性关系)
计算检验的t统计量;回归系数在(1-?)%置信水平下的置信区间为
;以例9.1来描述t检验。假设检验问题如下:
对沟通能力:H0:β1=0?H1:β1≠0
对乐观积极:H0:β2=0?H1:β2≠0
对学业成功:H0:β3=0?H1:β3≠0
;注意到这一模型的常数项也是统计不显著的,t值为-0.238,p-值为0.814。尽管如此,常数项仍应保留在模型中,除非有非常明确的理由才能剔除它,因为常数项反映了因变量的基准水平。
一般来说,不显著的自变量应从模型中剔除,但是常数项却
文档评论(0)