医学统计学第14,15讲 相关与回归分析(一、二).ppt

医学统计学第14,15讲 相关与回归分析(一、二).ppt

  1. 1、本文档共118页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医学统计学第14,15讲 相关与回归分析(一、二)

复习 检验、 检验; 检验; 秩和检验; 直线回归与相关; 研究方法 相关分析:反应变量间的密切程度与变化趋势 回归分析:变量间数量上的依存关系 回归分析分类 按变量间的关系可分为:直线回归和曲线回归。 按研究变量的数量可分为:一元回归与多元回归。 相关分析分类 按变量间的关系:线性相关与曲线相关 按资料的分布分析方法:Pearson相关与等级相关 SAH患者第一天血清和脑脊液 IL-6(pg/ml)检测结果 实 例 例10.1 某医院测量了10名3岁男童体重(X,kg)与体表面积(Y,103cm2),数据见表10.1,试作回归分析 。 表10.1 男童体重(X,kg)与体表面积(Y,103cm2) (1) 画散点图,判断是否有线性趋势。按(X,Y)实测值在直角坐标图上画出10个点,见图10.2。由散点图判断,两变量间有线性趋势,可以作直线回归分析。 (2) 求直线回归方程。在例10.1中已算得X和Y的均数、离均差平方和与离均差积和lXX,lXY,lYY。 =13.44,=5.7266,lXX=24.9040,lYY=1.5439,lXY=5.9396 按公式(11.2),(11.3)得回归系数和截距分别为: (103cm2/kg) a=5.7266-13.440.2385=2.5212(103cm2) 由此,可列出直线回归方程: (3) 绘制回归直线。在自变量X的实测范围内任取相距较远且易读数的两X值,代入直线回归方程求得两点(X1, ),(X2, ),过这两点作直线即为所求回归直线。本例取X1=12, 得 =5.3832;取X2=15, 得 =6.0987。 (二) 方差分析 应变量变异的分解 得F=89.01,今?1=1,?2=8,查附表4,F界值表,得P0.01,按? =0.05水准拒绝H0,接受H1,故可认为3岁男童的体重与体表面积之间有线性回归关系。 具体步骤 (1)用实测数据绘制散点图(scatter diagram) (2) 计算回归系数b与截距a (3)列出回归方程 (4)作出回归直线:在X值实际范围内任取 两点 (5)假设检验 注意事项 (1)直线通过点( ) (2) 实际意义:从专业角度对两个变量内在联系有一定认识,不能把毫无关联的两种现象勉强作回归分析。 (3)适用条件: Y为数值变量且服从正态分布,X为人为控制或精确测量,一般称为Ⅰ型回归。 若X,Y服从双变量正态分布,则对这种资料进行的回归称为Ⅱ型回归。可计算两个回归方程: (4)散点图:必需有直线趋势时,才适宜作直线回归分析。应注意资料有无异常点(outlier)及异常点的处理。 (5)范围:直线回归方程范围一般以自变量的取值范围为限,X不能偏离实测范围太远。 例: 设中学生身高Y(米)与年龄X(岁)的回归方程为 ,则初生婴儿的平均身高为0.5米。 (6)回归系数的意义 回归系数b称为斜率(slope),表示自变量增加一个单位时,应变量的平均改变量。在例11.1中,b=0.2385(103cm2/kg),表示体重增加1(kg),则体表面积平均递增0.2385(103cm2 )。或者说,体重为X+1(kg)的3岁男童,其平均体表面积比体重为X(kg)的3岁男童之平均体表面积多0.2385(103cm2)。 直线回归的区间估计 回归系数 ? 的可信区间估计 估计总体回归系数? 的100(1-? )%可信限为: 本例sb=0.02528, ?=10-2=8,查附表2,t界值表,得t0.05,8=2.306,故? 的95%可信区间为: (0.2385-2.306*0.02528,0.2385+2.306*0.02528) =( 0.1802,0.2968) (103cm2/kg) 的可信区间估计 点估计: 是在给定X下的条件平均值 的点估计 是当X固定时Y的总体中的条件均数 ,是有抽样误差的,其标准误 按下式计算: 的100(1-? )%可信限: ± 当X=12时, =5.3832 当X=12kg时, 的95%可信限为: 5.3832?2.306?0.0540=5.2587~5.

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档