九直线回归与相关(卫生统计学,余金明).PPTVIP

九直线回归与相关(卫生统计学,余金明).PPT

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共36页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
九直线回归与相关(卫生统计学,余金明)

第九章 直线回归与相关 Linear Regression and correlation 第一节 直线回归 一、概述 1、函数关系与回归关系 函数关系:自变量取某一数值时,应变量有一个完全确定的数值与之对应。(多见于物理、化学等学科,生物医学界不少变量间有一定的关系,但不是十分明确) 回归关系:应变量随自变量的变化而变化,且呈直线趋势,但并非所有的点子都在一直线上。 直线回归分析的任务:找出一条最能代表这些数据关系的一条直线。 方法:一般采用最小二乘法least square method找出一条各实测点与它的纵向距离的平方和为最小的直线回归方程。又称作最小二乘回归 变量y随变量x而变化,称x为自变量independent variable,y为应变量dependent variable. 2、直线回归方程 直线方程:y=a+bx 直线回归方程: a:为回归直线在Y轴上的截距intercept,a0表示直线与纵轴的交点在原点的上方,a0交点在原点的下方。a=0则回归直线通过原点 b:回归系数regression coefficient,为直线的斜率slope,bo直线从左下走向右上, b0从左上走向右下, b=0直线与横轴平行。意义:x每增(减)一单位,Y平均改变b个单位 3、最小二乘法 样本含量为n的的样本资料标在(x,y)平面上,可得n个点,故可确定很多直线,直线回归的主要目标之一是用实测的x估计y,所以希望估计的y与实测的y间的误差愈小愈好。即从所有直线中找到一条直线使估计误差平方和达最小。 即 最小 二、求直线回归方程的基本方法 P110例9-1: 1)由原始数据绘散点图,各点分布呈直线趋势,故作下列计算 2)求?x, ?y, ?x2, ?y2, ?xy 3)计算x,y的均数,lxx、lyy和lxy 4)求回归系数b和截距a 5)列出回归方程 6)直线回归方程图示:在自变量x的实测全距范围内任取相距较远且易读的两x值,代入回归方程求y的估计值,在图绘出两点连成直线。 注意:所绘直线必然通过 ,若纵坐标、横坐标无折断号时,将此直线左端延长与纵轴相交,交点的纵坐标必然等于截距a,这两点可用来核对回归线绘制是否正确。 第二节 直线回归分析中误差及可信区间 一、标准估计误差 估计误差error of estimate:在直线回归中,各实际值y与由回归方程计算出的估计值之间有一定的误差,称~。这种离差可以用类似标准差的式子进行计算,称为标准估计误差standard error of estimate。由于 决定于均数和回归系数,所以自由度为n-2 lyy的分析: p点的纵坐标被回归线、均数y 截成三段 SS总=SS回+SS剩 各实测点离回归直线越近,剩余平方和愈小,说明直线回归的估计误差愈小 ?总=?回+?剩 ?总=n-1,?回=1,?剩=n-2 二、实测值围绕回归线的离散度 回归分析时假设:X取某一值时,Y围绕回归线?+?x呈正态分布,Sy.x是其标准差?的估计值。 故可估计出约有95%观测值y在总体回归线y= ?+?x上下1.96个标准估计误差范围内,见P112图9-3 三、回归系数的标准误 表示:样本回归系数b对总体回归系数?进行估计时误差的大小 求?的95%可信区间 b?t0.05(?)Sb ,自由度=n-2 四、 的标准误 y的标准误本应由Sy/?n求得,但因在直线回归当中x的影响被扣除后,y方面的变异减小,故y的标准误,即x=x时y^的标准误为 五、 的可信区间 是总体均数? 的估计值 95%可信区间: 六、 的标准误 当xi?x时, 的变异不仅决定于y的误差,也与回归系数b的误差有关 七、 (个体y值)的可信区间 理论上,每个xi对应的y估计值都有一个区间估计,把这些可信区间的上限和下限连起来,为两条曲线。把这两条曲线间的空间称为回归直线的可信区间。 八、截距?的误差及总体参数?的可信区间 由于截距?是x=0时y的估计值, 九、单一个体yi值的范围预测 第三节 回归系数和截距的统计意义检验 一、回归系数的t检验 二、回归系数的方差分析 所得结论与t检验相同 三、两个回归系数差别的统计意义检验 P119,例9-3 四、截距的统计意义检验 检验a是否是从总体截距为0的总体中抽样得到 t=a/Sa 自由度为n-2 五、两条回归线高度差别的统计意义检验 当两条回归线的回归系数的差别无统计意义时,可以用一公

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档