- 1、本文档共28页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元线性回归分析课件.ppt
残差:实测值Y与其估计值Y之差。残差平方:扣除自变量x的影响后,其他因素对y的值的贡献。决定系数:ss回/ss总 ,调整决定系数:随着回归方程自变量的增多,决定系数表现为只增不减,这是决定系数的缺点。 * 例如X1为米为单位的身高,X2为厘米的身高,两个变量的意义是一样的 * 对两个回归方程的斜率的平行性进行检查:对全部数据建立的自变量包含性别,年龄,和二者乘积的多元回归模型,然后检查乘积是否有统计学意义,如果无,则两直线平行,可以合并两组数据。反之亦然。 * 在参数估计的结果中,发现有的变量回归系数不显著,如tax,bedrooms,rooms,对应的p值大于0.5,这说明其不适合纳入模型,因此需要对变量进行筛选。 * 3step完成筛选,写出回归方程。 * 李国奇 安贞医院 多元线性回归 (multiple linear regression) 主要内容 第一节:多元线性回归概念及统计描述 第二节:多元线性回归假设检验 第三节、多元线性回归自变量的筛选 第四节:多元线性回归应用 第五节:多元线性回归应注意问题 第六节:实例分析(SAS) 第一节:多元线性回归概念及统计描述 概念:用于分析一个连续型因变量与多个自变量之间的线性关系的统计学分析方法。 例:血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史 糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂 多元线性回归数据结构 假定对n例观察对象逐一测定了因变量Y与m个自变量X1,X2,…Xm的数值。 ━━━━━━━━━━━━━━━━━━━━━━ 例号 X1 X2 … Xm Y ───────────────────── 1 X11 X12 … X1m Y1 2 X21 X22 … X2m Y2 3 ┆ ┆ … ┆ ┆ n Xn1 Xn2 … Xnm Yn ━━━━━━━━━━━━━━━━━━━━━━ 多元线性回归模型 多元线性回归数学模型: 相应的由样本估计而得到的回归模型: 其中?表示Y的总体平均值的估计值, b0为常数项,也称为截距,bi为Xi的偏回归系数,表示当方程中其他自变量不变时,自变量Xi变化一个计量单位,反应变量Y的总体平均值的估计值变化的单位数. 标准化偏回归系数 因为各自变量都有各自的计量单位以及不同的变异度,所以不能直接用普通偏回归系数的大小来比较方程中各个自变量对反应变量Y的影响大小。需要求出标准化偏回归系数。 设:与一般回归系数bi对应的标准化偏回归系数为Bi,则 SXi、SY分别为Xi和Y的标准差。 偏回归系数的估计--最小二乘法 基本思想:利用收集到的因变量和自变量建立线性函数,使得每一个实际测量的Yi与估计的Yi之间的离差的平方和尽可能的小。 只有一个自变量时,回归结果为二维平面的一条直线,而有两个自变量时,结果为三维空间的一个平面,有更多的自变量时,回归的结果则是在三维以上空间的“超平面”,无法直观图形表达,只能想象。 多元线性回归分析前体条件——LINE (1)linear : Y与X1, X2,…, Xm之间具有线性关系。 (2)independent :各个体观测值间相互独立。 (3)normal distribution :在一定范围内,对任意一组自变量X1, X2,…, Xm值,Y都服从正态分布。 (4)equal variance :在一定范围内,不同组自变量对应的Y具有相同方差。 残差分析 通过残差分析可以深入了解实际资料是否符合回归模型假设(如正态、方差齐) 多元线性回归决定系数 决定系数:回归平方和(SS回)在总平方和( SS总)中比例。 R2=SS回/SS总 0≤R2≤1,R2接近1, 表示样本数据很好的拟合了所用的线性回归模型。 R2反映了线性回归模型能多大程度上解释Y的变异。 第二节:多元线性回归假设检验 在多元线性回归模型中,由于变量众多,需要对模型的合理性以及参数的显著性进行检验。 一、回归方程的假设检验(F检验) H0 :β1=β2=…=βp=0 H1: β1,β2…βp不全为0 如果H0成立,认为回归方程不显著,如果拒绝H0 ,认为回归方程
文档评论(0)