网站大量收购闲置独家精品文档,联系QQ:2885784924

卫生统计学线性相关与回归.pptVIP

卫生统计学线性相关与回归.ppt

此“医疗卫生”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共24页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
卫生统计学线性相关与回归

中医科研设计与统计 湖北中医学院卫生教研室 中医科研设计与统计 湖北中医学院基础部卫生生物教研室(J-C204) Tel:027E-Mail:annworld@163.com 第十章 线性相关与回归 第一节 线性相关 第二节 线性回归 第三节 线性相关和回归的区别与联系 第四节 等级相关 概述 “回归”名称的由来:最早由英国遗传学家弗朗西斯·高尔顿(Francis Galton)引入。在一篇著名的论文“Family Likeness in Stature”中,高尔顿发现,虽然有一个趋势:父母高,子女也高;父母矮,子女也矮,即父母的身高对子女的身高起到决定性作用。但给定父母的身高,子女的平均身高却趋向于或者“回归”到种族人群的平均身高。 换言之,尽管父母都非常高或非常矮,但儿女的身高却有回归到人群总体平均身高的趋势。这就是Galton的普遍回归定律(law of universal regression)。 现代统计学奠基人卡尔·皮尔逊(Karl Pearson)也证明了子女身高确实“回归到中等”(regression to mediocrity)。他发现,对于一个父亲高的群体,儿子的平均身高通常低于他们父辈的身高;而对于一个父亲矮的群体,儿子的平均身高通常高于其父辈的身高。即高的和矮的儿子身高一同“回归”到所有男性的平均身高。 皮尔逊观察了1078对夫妇,以每对夫妇中父亲的身高作为解释变量X(自变量),取他们的一个成年儿子的身高作为被解释变量Y(应变量),将结果在平面直角坐标系上绘成散点图,发现散点的趋势近乎一条直线。计算出直线回归方程为: 回归的现代释义 在普遍回归定律中,高尔顿的兴趣在于发现为什么人口的身高分布有一种稳定性。但是现代统计学并不关心这种解释,我们关心的是知道了父辈的身高,怎样去估计或预测子女的身高。 回归的现代解释和应用大致上可以这样说:回归分析是研究一种叫做被解释变量(或称应变量:Dependent Variable)的变量对另一种叫做解释变量(或称自变量:Independent Variable)的变量之间依赖关系的统计方法,当解释变量取某个已知或设定值时,能够估计或预测出与之相关的被解释变量所有可能出现对应值的(总体)均值。 变量关联性分析 直线相关与回归的区别 直线相关分析: 研究两随机变量之间的是否存在线性关系,以及线性关系的性质和强弱; 分析的两变量没有自变量和应变量之分; 两变量间是共变关系(双向),地位是平等的; 不能用一个变量去预测或控制另一个变量的变化。 第一节 线性相关 一、二维散点图 例1:一个产科医师发现孕妇尿中雌三醇含量与新生儿的体重有关。于是设想,通过测量待产孕妇尿液中雌三醇含量,是否可以预测新生儿体重,以便对低体重新生儿进行预防准备。因此收集了31例待产孕妇24小时的尿液,测量其中的雌三醇含量,同时记录新生儿的体重。数据记录如表1所示: 31例待产妇尿雌三醇含量(mg/24h)与新生儿的体重(kg) 相关系数的性质 相关系数的定义阈:-1≤r≤1,其中绝对值大小反映了两随机变量之间相关关系的密切程度,而正负则反映了相关关系的方向。 +1>r>0:正相关 -1<r<0:负相关 r=0:零相关或无相关 r=+1:完全正相关 r=-1:完全负相关 生物界影响因素众多,|r|值为l的机会极为罕见,因而很少有完全相关。在医学数据中经常见到的是r值介于-1与+l之间,即不完全相关。 相关关系示意图 计算例1资料的相关系数 ∑x=534,∑y=99.2 ∑x2=9876,∑y2=324.18,∑xy=1750,n=31 相关系数的假设检验 上例中的相关系数r等于0.6097不为0,说明了31例样本中雌三醇含量与出生体重之间存在相关关系。但是,这31例只是总体中的一个样本,由此得到的相关系数必然会存在抽样误差。 因为:即使总体相关系数?为零时,由于抽样误差,从总体抽出的31例样本,其相关系数r也可能不等于零。 所以,我们必须对该样本所代表总体的相关系数?是否为0进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。 1.查表法:以自由度v=n-2直接查r界值表。 查t界值表t0.05(29)=2.045 2.t检验: H0:?=0,雌三醇含量与出生体重不存在相关关系 H1:?≠0,雌三醇含量与出生体重存在相关关系 α=0.05 查t界值表t0.05(29)=2.045<t,在α=0.05水准拒绝H0,认为总体相关系数不为零,雌三醇含量与新生儿出生体重之间存在线性相关关系。 3.F检验(方差分析):F0.05(1,29)=4.18 将y的总平方和分解为相关平方和和非相关平方和。 t检

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档