- 1、本文档共34页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
例 子 第一节 多元线性回归 (multiple linear regression ) 多元线性回归的数据格式 一 、多元线性回归方程(multiple linear regression equation) 两个自变量与应变量的拟合面 1. 求偏回归系数bj及b0 根据最小二乘法(method of least square)原理求出bj , 即 2.例 子例11.1 20名糖尿病人的血糖、胰岛素及生长素的测定值列于下表中,试建立血糖对于胰岛素及生长素的二元线性回归方程。 对于本例有: 对表11-2的数据资料由SAS统计软件可得到如下表11-3的主要结果。 ? 二、回归方程的假设检验 1.模型检验 其中: 2.偏回归系数的检验 (1)F 检验 表11-5 例11.1数据的偏回归系数F检验表 三、标准化回归系数(standardized partial regression coefficient) 1.复相关系数( multiple correlation coefficient)又称多元相关系数或全相关系数,表示回归方程中的全部自变量 X共 同对应变量Y的相关密切程度。复相关系数取值总为正值,在0与1之间,简记为R。如果只有一个自变量,此时 2.决定系数(coefficient of determination) 复相关系数的平方又称决定系数,记为 ,用以反映线性回归方程能在多大程度上解释应变量Y的变异性。 第二节 多元逐步回归 (multiple stepwise regression) 1. 多元逐步回归的基本思想 多元逐步回归(multiple stepwise regression) 有三种筛选自变量的方法 : 1.向后法(Backward selection) 先建立一个全因素的回归方程,然后每次剔除一个偏回归平方和最小且无统计学意义的自变量,直到不能剔除时为止,此法的计算量大,有时不能实现。 2.向前法(forward selection) 方程由一个自变量开始,每次引入一个偏回归平方和最大,且具有统计学意义的自变量,由少到多,直到无具有统计意义的因素可以引入为止。用此法建立的方程有时不够精炼。 3. 逐步法(stepwise selecfion) 取上述两种方法的优点,在向前引入每一个新自变量之后都要重新对前已选入的自变量进行检查,以评价其有无继续保留在方程中的价值。为此引入和剔除交替进行,直到无具有统计学意义的新变量可以引入也无失去其统计学意义的自变量可以剔除时为止。 2.多元逐步回归的基本原理 每一步只引入或剔除一个自变量。自变量是否被引入或剔除则取决于其偏回归平方和的F检验或校正决定系数。 如方程中已引入了(m-1)个自变量,在此基础上考虑再引入变量Xj 。记引入Xj 后方程(即含m个自变量)的回归平方和为SS回归,残差为SS残差;之前含(m-1)个自变量(不包含Xj )方程的回归平方和为SS回归(-j) ,则Xj 的偏回归平方和为 U = SS回归-SS回归(-j),检验统计量为: 3. 多元逐步回归的检验水平 在进行逐步回归前,首先应确定检验水平,以作为引入或剔除变量的标准。检验水平可以根据具体情况而定,一般可将 F 值定在 ? 为0.05、0.10或0.20水平上。对于回归方程的选入和剔除水平往往选择 ?选入≤?剔除。 选择不同的F 值(或?水平),其回归方程的结果可能不一致,一般可选不同的F 值(或?值) 作调试。至于何种结果是正确的,必须结合医学的实际意义来确定。 4.多元逐步回归事例 对例11.2采用逐步法筛选自变量,选入水准为 0.10,剔除水准为0.15,SAS 软件计算过程及相应结果见表11-8至 表11-11。 第三节多元线性回归的注意事项 1. 应用条件 (1) 线性依存关系 应变量与自变量间具有线性依存关系。 (2) 正态性 应变量原则上是连续型可测正态变量,其预测值与实际观测值的差值(即残差)服从正态分布,当样本量较大时可以忽略正态性的要求。 (3)独立性 观察单位之间是独立的,即应变量的观测值相互独立。 2. 样本含量 一般应使样本量是自变量个数的 5 倍以上。3.自变量的数量化 注意名义变量
文档评论(0)