- 1、本文档共66页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《医学统计学教学课件》10简单回归分析
n=14,?=12,查t界值表,得P0.001。 按?=0.05水准,拒绝H0,接受H1。可以认为健康的中年女性体重与基础代谢之间存在直线回归关系。 注意: ,即直线回归中对回归系数的t检验与F检验等价,类似于两样本均数比较既可以作t检验亦可作单因素方差分析。 此直线必然通过点( , ),且与纵坐标轴相交于截距a 。如果散点图没有从坐标系原点开始,可在自变量实测范围内远端取易于读数的值代入回归方程得到一个点(或二个点)的坐标,连接此点与点( , )也可绘出回归直线。散点图 绘制回归直线 (二)总体回归系数?的置信区间 利用上述对回归系数的t 检验,可以得到β的(1-α)双侧置信区间为 本例b=61.4229, 自由度?=12,t0.05/2,12=2.179,Sb=4.881,代入公式,得: 总体回归系数β的95%置信区间为: 61.4229-2.179×4.881,61.4229-2.179×4.881 =(50.787 , 72.059) 注意: 此区间不包括0,按?=0.05水准同样可以得到总体回归系数?不为0的结论,即用区间估计法回答取相同?时的假设检验问题。 决定系数(coefficient of determination) R2为回归平方和与总平方和之比。 R2取值在0~1之间,且无单位,其数值大小反映了回归贡献的相对程度,也就是在Y的总变异中由于X与Y之间的回归关系所能解释的Y变异的百分比。 如例相关系数r=0.964,得到R2=0.930,表示中年健康女性的体重X可解释其基础代谢Y变异性的93%,另外约7%的Y变异需要通过体重X以外的其它因素来解释。 当SS总固定不变时,回归平方和的大小决定了相关系数r绝对值的大小。回归平方和越接近总平方和,则r绝对值越接近1,说明相关的实际效果越好。 六、直线回归应用的注意事项 1.进行回归分析前应绘制散点图 ①散点图可考察两变量是否有直线趋势; ②可发现异常点(outlier)。 散点图对异常点的识别与处理需要从专业知识和现有数据两方面来考虑,结果可能是现有回归模型的假设错误需要改变模型形式,也可能是抽样误差造成的一次偶然结果甚至过失误差。需要认真核对原始数据,并检查其产生过程,认定是过失误差或者通过重复测定确定是抽样误差造成的偶然结果,才可以谨慎地剔除或采用其它估计方法。 2.根据分析目的选择变量及统计方法 直线回归用于定量刻画应变量Y对自变量X在数值上的依存关系,其中应变量的定夺主要依专业要求而定,可以考虑把易于精确测量的变量作为X,另一个随机变量作Y,例如用身高估计体表面积。 两个变量的选择一定要结合专业背景,不能把毫无关联的两种现象勉强作回归分析。 3.资料的要求 直线回归要求至少对于每个 X 相应的 Y 要服从正态分布,X可以是服从正态分布的随机变量也可以是能精确测量和严格控制的非随机变量; ?对于双变量正态分布资料,根据研究目的可选择由 X 估计 Y 或者由 Y 估计 X ,一般情况下两个回归方程不相同,但无论哪个变量做X或Y ,其相关系数是相同的。 反应两变量数量上影响大小的统计量应该是回归系数的绝对值,而不是假设检验的P值。 P值越小只能说越有理由认为变量间的直线关系存在,而不能说关系越密切或X对Y的影响越“显著”。 直线回归用于预测时,其适用范围一般不应超出给定样本中自变量的取值范围。 4.结果解释及正确应用 当实际资料不能满足直线回归模型的要求而无法用最小二乘法估计回归方程时,可使用秩回归。 5、对同一组资料,b与r正负号相同,且tb=tr。 故可用查表法进行r的假设检验来代替b的假设检验。若x、Y服从双变量正态分布,一般是先作直线相关分析,需要时,再作直线回归分析。 七、直线回归方程的应用 1.描述因变量Y依赖自变量x变化而变化的数量关系。 例如:儿童体重依赖年龄变化而变化的数量关系。 2.根据容易测定的变量估计难以测定的变量值。 例如:以人的体重估计人的体表面积。 3.由已知变量(预报因子x)预测将来未知变量(预 报量Y)。例如:由父母的身高预测子女将来的身高。 4.利用直线回归方程进行统计控制,即利用回归方程 进行逆估计。 例如:把汽车流量(x)与汽车排出的某种毒物( Y )建立直线回归方程,若要求Y在一定的波动范围内(卫生标准以下),可通过控制x的取值来实现。 5.进行统计预测。 八、直线相关与回归的区别和联系 1.区别: 1)分析目的:相关分析研究两变量相关方向及密切程度;回归分析研究两变量间的数量依存关系。 2)资料要求:相关分析要求两变量都是随机变量,分别服从正态分布
文档评论(0)