单元统计学高篇.PPTVIP

下载本文档

5
0
约5.74千字
约 73页
2017-04-08 发布于江苏
举报
版权申诉

单元统计学高篇.PPT

此“教育”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、本文档共73页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

单元统计学高篇

第二单元医学统计学（高级篇）第八章多重线性回归第一节多重线性回归分析的概念一、多重线性回归的概念多重线性回归是研究多个自变量（x1\x2..）与一个因变量(y) 之间线性依存关系的方法。其中自变量可以是随机变量，也可以是给定变量，而因变量是随机变量。多元线性回归是研究多个自变量与多个因变量线性依存关系的方法。若所有变量都是随机的，还可以做多重相关分析，描述因变量与一组自变量之间的线性关系；用偏相关描述因变量与一个自变量之间，在扣除其他自变量影响之后的线性关系。二、多重线性回归模型与方程多重线性回归模型用于研究一个被解释变量（因变量）与多个解释变量（自变量）的线性关系分析。多重线性回归模型与一元线性回归模型基本类似，只不过解释变量由一个增加到两个以上，被解释变量y与多个解释变量x1,x2···xk之间存在线性关系。假定被解释变量y与多个解释变量x1,x2···xm之间具有线性关系，建立多重线性回归模型为：其中y为被解释变量，xi为k个解释变量，βi为偏回归系数，表示在其他自变量固定的条件下，自变量Xi改变一个单位时，因变量Y的平均改变量。ε为随机误差项。三、回归模型的前提条件多重线性回归方程：描述被解释变量y的期望值或平均值如何依赖于解释变量x的方程为：回归模型的前提条件： 1）线性：是指反应变量Y的总体平均值与自变量X呈线性关系； 2）独立性：自变量间相互独立，自变量之间没有精确的线性关系（不相关）； 3）正态性：是指对于给定的X值，其对应的Y值的总体和线性模型的误差项ε均服从正态分布；（ε服从均数为0的正态分布） 4）等方差性：无论X如何取值，Y都有相同的方差；误差项的方差相等。第二节多重线性回归分析步骤一、参数估计：根据样本数据，求得模型参数的估计值，即求出模型β的估计值b0、bm后，建立回归方程。多重回归采用最小二乘法估计其参数，即求出与实际观察值Y之差的平方和（残差平方和）为最小的b0、b1、b2、 bm值。多重回归的参数估计和假设检验，常采用统计软件完成。求出参数的估计值后，可建立方程。例8-1 下表是27名糖尿病人的血清总胆固醇、甘油三酯、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值，试建立血糖与其它几项指标关系的多重线性回归方程。 27名糖尿病人血糖与其它变量的测量值 27名糖尿病人血糖与其它变量的测量值二、建立方程经统计软件处理后，得各参数如下：得回归方程为：三、多重回归分析的假设检验及评价（一）回归方程（模型）的假设检验：检验模型是否成立，或方程是否有意义。方差分析法多重线性回归方差分析表以上结果显示：接受H1，回归方程成立。（相关公式）（二）有关评价指标 1.残差标准差(剩余标准差)SY,1,2, …M：为扣除m个自变量影响外，因变量仍存在的变异，不能用自变量的变化解释Y的变异。反映回归方程精度，值越小说明回归效果越好。 2.决定系数R2: R2:说明所有自变量能解释Y变化的百分比。取值范围(0,1),越接近1，模型拟合效果越好。R2反映在Y的总变异中，自变量组合解释部分，占总变异的比重，即线性回归模型能在多大程度上解释应变量Y的变异性。自变量对应变量贡献越大，回归效果越好。 SY,1,2, …M与R2 3.校正决定系数RC2(Radj2)=0.5282 R2与RC2关系： R2表示总变差中已由多元回归方程“解释”的比例，R2可解释模型的拟合优度，残差平方和越小，决定系数越接近1，回归方程的拟合程度越好。 RC2当给模型增加自变量时，决定系数也随之逐步增大，然而决定系数的增大代价是自由度的减少。自由度小意味着估计和预测的可靠性低。为了克服样本决定系数的这一缺点，我们设法把R2给予适当的修正，这就是校正决定系数。 R2或RC2只能说明在给定的样本条件下回归方程与样本观测值拟合优度，并不能做出对总体模型的推测，因此不能单凭它们来选择模型。 4.复相关系数R R说明所有自变量与Y间的线性相关程度,而不反应相关的方向。取值范围（0，1），R越接近1，说明所有自变量与应变量Y间的关系越密切。如果只有一个自变量，此时的R=∣r∣。（r为pearson相关系数）（三）偏回归系数的假设检验及评价偏回归系数的假设检验（即各自变量贡献大小的检验），有三种方法。 1.t检验法： t检验显示：胰岛素x3、糖化血红蛋白x4与血糖y有线性回归关系。 t检验显示：胰岛素x3、糖化血红蛋白x4与血糖y有线性回归关系。机读显示相同结果。 2.方差分析法（求x的偏回归平方和）机读显