- 1、本文档共57页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
例:8名儿童的年龄与尿肌酐的含量数据在坐标轴上描点,即散点图。在定量描述儿童年龄与其尿肌酐含量数量上的依存关系时,年龄作为自变量,用X表示。尿肌酐含量作为应变量,用Y来表示。 ? ? ? ? ? ? ? ? x y 直线回归 =a + bX a为截距(intercept) X = 0时,回归直线与Y轴 交点到原点的距离。 a 0,表示回归直线与Y轴的交点在X轴的上方; a 0,表示回归直线与Y轴的交点在X轴的下方; a = 0 则回归直线通过原点。 b 为回归系数(coefficient of regression) 即直线的斜率(slope)。 b 0,表示随X增加,Y亦增加; b 0,表示随X增加,Y值减小; b = 0,则回归直线与X轴平行,表示Y与X无关。 直线回归方程的估计 从散点图上可看出,a和b实际上是要合理的找到一条能够最好代表数据点分布趋势的直线。 如果将实际测得的Y值与假定回归线上的估计值称为残差,最好就是各点的残差要尽可能的小,用残差平方和来表示,这条回归线就是残差平方和最小的直线。 利用最小二乘原则估计a和b,那么b和a的计算的公式如下: 直线回归的适用范围和参数意义 直线回归的适用范围: 自变量和应变量间呈线性趋势; 每个个体间必须相互独立; 对于每个X相应的Y服从正态分布,而X可以是服从正态分布的随机变量,也可以是能精确测量和严格控制的非随机变量; 不同x对应的y方差要相等。 参数的意义: 回归模型中参数a的统计学意义:当x=0时,y的平均水平; 参数b的统计学意义:x每增加一个单位,y相应的增加b个单位,或者减少b个单位。b的绝对值越大,表示x对y的影响就越大。 回归方程的假设检验 对样本回归系数b作总体回归系数β是否为零的假设检验。 方法: 方差分析 基本思想是对应变量Y的离均差平方和分解,分解为两部分,回归平方和(SS回)以及残差平方和(SS残)。 t检验 直线相关 ? ? ? ? ? ? ? x y ? ? ? ? ? ? ? ? ? x y ? ? ? ? ? ? x y ? ? ? ? ? ? x y * 相关系数 相关系数r表示有直线关系的两变量间相关关系的密切程度和相关方向的统计指标。 -1 ≦ r ≦ 1 r ﹥ 0,为正相关; r ﹤ 0,为负相关; r = 0,为无相关。 假设检验方法:采用t检验 决定系数:R2,反映了回归贡献的相对程度。 多因素模型和相关要求 疾病的发生、发展、干预到最终的转归,是一个十分复杂的病理生理过程,受到很多因素的影响。 常用的多因素分析方法中,一般的表达方式是: Y=X1+X2+X3+X4+…+Xn 其中Y是应变量,即结局指标。 在统计分析时,首先做单因素分析,参考单因素分析的结果,在多因素分析时,在模型中纳入有意义的变量。如果单因素分析发现某个变量没有统计学意义,但文献报道这个变量可能是有意义,那么要纳入这个变量到多因素模型中。 多因素分析时,还要注意样本量的问题。 常用的多因素分析模型 在医学研究中,最常用的多因素分析的方法:多元线性回归分析、Logistic回归分析和Cox回归分析等。 多元线性回归分析 是研究一个因变量与多个自变量间线性依存关系数量变化规律的一种方法。 多元线性回归方程:Y=β0+β1X1+β2X2+β3X3+…+βnXn+e β0是截距,回归方程的常数项。其中β1、β2…,是偏回归系数。模型中的e是残差。 多元线性回归分析的条件:第一、因变量是数值变量,且满足随机性和独立性。第二、因变量和自变量之间要有线性关系。第三、残差要服从正态分布。 多元线性回归模型假设检验 回归方程的假设检验 方差分析,根据计算的F值推断所拟合的回归方差是否具有统计学意义。 根据方差分析的结果,可得到多元线性回归的决定系数,R2,计算公式如下: 各个自变量的假设检验 偏回归平方和 t检验法, 与偏回归平方和的检验是等价的。 标准化回归系数,首先对数据做标准化处理,经过标准化处理后得到的回归方程,即标准化回归方程,相应的回归系数即标准化回归系数。 多元线性回归分析注意的问题 当自变量是无序分类变量时,一定要进行哑变量的处理,如果自变量是有序分类变量,有2种处理方法,一种是把它当作连续变量来处理,另外一种是哑变量的处理。 多元线性回归要注意多重共线性的问题。多重共线性是指一些个自变量之间存在着较强的线性关系。 变量间的交互作用。 多元线性回归的应用 影响因素的分析,混杂因素的控制; 估计与预测,如根据胎儿的孕龄、头颈、胸径和腹径预测出生时体重; 统计控制,统计控制是指利用回归方程进行逆估计。 L
文档评论(0)