景学安《医学统计学》09 第九章 直线相关与回归分析20130204.pptVIP

景学安《医学统计学》09 第九章 直线相关与回归分析20130204.ppt

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第九章 直线相关与回归分析 目录 教学目的及要求 掌握直线相关与回归的概念、意义及应用条件; 掌握直线相关与回归各指标的意义、应用及计算方法; 熟悉直线相关与回归的联系及区别; 了解曲线回归的概念、意义及类型。 例9-1 某研究者测量10名20岁男青年身高与前臂长,见下表。 问身高与前臂长有无直线相关关系? 第一节 直线相关(linear correlation) 一、基本概念 1、直线相关: 当两正态分布变量在数量上的变化呈直线趋势时,则称为直线相关,又称简单相关(simple correlation),用于分析双变量正态分布资料。 表示两变量相关关系的重要指标就是相关系数, 总体的相关系数 ρ 样本的相关系数 r 概念:描述两变量间相关关系的密切程度和相关方向。用符号ρ(r)表示,其数值1≥ ρ(r) ≥-1。 相关方向: 当ρ(r)为正值时,表示一变量随另一变量的增加而增加称为正相关; 当ρ(r)为负值时,表示一变量随另一变量的增加而减少,称为负相关。 密切程度: 当│ρ(r)│愈接近1,表示两变量的相关愈密切; 当│ρ(r)│愈接近0时,表示两变量相关程度愈低; 当│ρ(r)│=0时,称为零相关,表示两变量无直线相关关系, 当│ρ(r)│=1时,称为完全相关,表示两变量呈直线关系(x y有直线函数关系),见示意图9-1。 一般认为,当样本含量较大的情况下(n>100),大致可按下列标准估计两变量相关的程度 │r│≥0.7 高度相关 0.7>│r│≥0.4 中度相关 0.4>│r│≥0.2 低度相关 图9-1 相关系数示意图 图9-2 相关系数大小比较 二、相关系数的计算 相关系数r的计算公式: 计算公式为: 例9-1 某研究者测量10名20岁男青年身高与前臂长,见下表。 问身高与前臂长有无直线相关关系? (1)由原始数据绘制散点图9-2,本资料呈直线相关趋势。 (2)根据表9-1原始数据计算出: ∑X,∑Y,∑X2,∑Y2,∑XY 。 本例∑X=1725,∑Y=454, ∑X2=298525,∑Y2=20690,∑XY=78541。 (3)计算X、Y的离均差平方和与离均差积和 (4)求相关系数r 1、t 检验法 t检验的计算公式 (1)建立检验假设 Ho:ρ=0 ,两变量间无直线相关关系 H1:ρ≠0 ,两变量间有直线相关关系 α=0.05 (2)计算t值 本例n=10, r=0.8227 ,按公式(9.5)和公式(9.6) 计算t值 (3)确定P值,作出推断结论 按ν=n-2=8查t界值表,得 0.002P0.005,按α=0.05水准,拒绝Ho,接受H1,故可认为20岁男青年身高与前臂长呈正直线相关关系。 2、查表法 查附表14, r界值表列出了相关系数r与0差别有统计学意义的判断界值,按自由度=n-2查r界值表, 当r≥rα(n-2)时,则P≤α ;反之,r< rα(n-2) 时,则P>α 。本例r=0.8227,大于r0.05(8)=0.632 ,故P0.05。r值有意义。检验结果与t检验相同。 1、进行相关分析前应先绘制散点图。 2、直线相关分析的统计推断要求两个随机变量均服从正态分布。 3、出现离群点时慎用相关。 4、相关关系不一定是因果关系。 5、分层资料不可盲目合并。 第二节 直线回归(linear regression) 一、直线回归的概念 1、回归:反映两变量数量依存的关系,即指由一个变量推算另一个变量的数量关系。 直线回归是回归分析中最基本最简单的一种,故又称简单回归(simple regression)。 2、反映回归关系的方程称为直线回归方程。 求直线回归方程,关键在于计算a、b两个系数,根据数学上的最小二乘法原理即保证各实测点至回归直线的纵向距离的平方和最小。 (1)列回归系数计算表同表9-1,求出ΣX ,ΣY ,ΣXY , ΣX2 , ΣY2 。 本例ΣX=1725 ,ΣY=454 ,ΣXY=78541 ,ΣX2=298525 ,ΣY2=20690 。前面已经计算出 lxx=962.5 ,lxy=226 (3)求回归系数b和截距a 在自变量X的实测值范围,任意指定相距较远且易读的两个数值,代入直线回归方程,求出相应的Y的估计值,确定两点,用直线连接。 如本例取X1=155,则 ;X2=185,则。在图上确定(155,41.291)和(185,48.335)两个点,直线连接,即得出直线回归方程的图形。 图9-2 20岁男青年身高与前臂长散点图 回归系数b为样本回

您可能关注的文档

文档评论(0)

1243595614 + 关注
实名认证
文档贡献者

文档有任何问题,请私信留言,会第一时间解决。

版权声明书
用户编号:7043023136000000

1亿VIP精品文档

相关文档