统计学课件Ch多元线性回归分析.PPTVIP

统计学课件Ch多元线性回归分析.PPT

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共47页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学课件Ch多元线性回归分析

第十五章 多元线性回归分析 目的:作出以多个自变量估计应变量的多元线性回归方程。 资料:应变量为定量指标;自变量全部或大部分为定量指标,若有少数定性或等级指标需作转换。 用途:解释和预报。 意义:由于事物间的联系常常是多方面的,一个应变量的变化可能受到其它多个自变量的影响,如糖尿病人的血糖变化可能受胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂等多种生化指标的影响。 变量:应变量 1 个,自变量m 个,共 m+1 个。 样本含量:n 数据格式见表15-1 回归模型一般形式: 三、假设检验及其评价 3.标准化回归系数 变量标准化是将原始数据减去相应变量的均数,然后再除以该变量的标准差。 注意: 一般回归系数有单位,用来解释各自变量对应变量的影响,表示在其他自变量保持不变时, 增加或减少一个单位时Y的平均变化量 。不能用各 来比较各 对 的影响大小。 标准化回归系数无单位,用来比较各自变量对应变量的影响大小, 越大, 对 的影响越大。 第二节????自变量选择方法 例15-2 用全局择优法对例15-1数据的自变量进行选择。 第三节 多元线性回归的应用及其注意事项 2.样本含量: n =(5~10)m。 3.关于逐步回归: 对逐步回归得到的结果不要盲目的信任,所谓的“最优”回归方程并不一定是最好的,没有选入方程的变量也未必没有统计学意义。例如,例15-3中若将选入标准和剔除标准定为 和 ,选入的变量是 ,而不是 ,结果发生了改变。 不同回归方程适应于不同用途,依专业知识定。 4. 多重共线性 即指一些自变量之间存在较强的线性关系。如高血压与年龄、吸烟年限、饮白酒年限等,这些自变量通常是高度相关的,有可能使通过最小二乘法建立回归方程失效,引起下列一些不良后果: (1)参数估计值的标准误变得很大,从而t值变得很小。 (2)回归方程不稳定,增加或减少某几个观察值,估计值可能会发生很大的变化。 (3)t检验不准确,误将应保留在模型中的重要变量舍弃。 (4)估计值的正负符号与客观实际不一致。 二、逐步选择法 1. 目的:解释效果好 意义:选择对应变量作用显著的自变量 选择方法: 1. 1.前进法,回归方程中的自变量从无到有、从少到多逐个引入回归方程。此法已基本淘汰。 2.?后退法,先将全部自变量选入方程,然后逐步剔除无统计学意义的自变量。 剔除自变量的方法是在方程中选一个偏回归平方和最小的自变量,作F检验决定它是否剔除,若无统计学意义则将其剔除,然后对剩余的自变量建立新的回归方程。重复这一过程,直至方程中所有的自变量都不能剔除为止。理论上最好,建议使用采用此法。 3.逐步回归法,逐步回归法是在前述两种方法的基础上,进行双向筛选的一种方法。该方法本质上是前进法。 表15-7 逐步回归过程 表15-8 例15-3方差分析表 “最优”回归方程为 结果表明:血糖的变化与甘油三脂、胰岛素和糖化血红蛋白有线性回归关系,其中与胰岛素负相关。由标准化回归系数看出,糖化血红蛋白对空腹血糖的影响最大。 表15-9 例15-3的回归系数的估计及检验结果 一、多元线性回归的应用 二、多元线性回归应用的注意事项 1.指标的数量化 分2类,可用一个(0,1)变量。如性别 分k类,k-1个(0,1)变量,如血型。 数据格式回归方程 建立回归方程 b1 :相当A 型相对于O 型的差别 b2 :相当B 型相对于O 型的差别 b3 :相当AB 型相对于O 型的差别 (3)等级 定量。 一般是将等级从弱到强转换为 (或 )如文化程度分为小学、中学、大学、 大学以上四个等级。Y为经济收入。 解释:b(b1)反映X(X1) 增加1个单位, 增加b个单位(如:500元)。 表示中学文化较小学收入多500, 大学较中学多500,余类推。 b1,b2,b3分别反映中学、大学、大学以上相对于小学文化程度者经济收入差别的大小 也可将K个等级转换为K-1个(0,1)变量 消除多重共线性:剔除某个造成共线性的自变量,重建回归方程;合并自变量;采用逐步回归方法。 * * (multiple linear re

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档