[医学]第十二章 简单回归分析.ppt

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[医学]第十二章 简单回归分析

简单回归分析 simple linear regression (linear regression) “回归” 的来源 Golton研究儿子身高(Y)与父亲身高(X)间关系时提出,后用来描述通过自变量的数值预测反应变量的平均水平 简单线性回归SPSS图示 绘制教材232页残差图 预测值、残差、置信区间与预测区间 教材229页表12-2 回归方程式及假设检验结果 个体Y预测值的区间估计 仍以第一观测点为例,计算该点预测值的标准差及95%预测区间为: 个体Y预测值的区间估计和Y的总体均数的置信区间 X Y PI PI CI CI Y总体均数的(1-?)置信区间 个体Y值的(1-?)预测区间 残差分析 残差指观测值Yi与回归模型拟合 值之差。 它反映模型与数据拟合优劣的信息。残差分析旨在通过残差深入了 了解数据与模型之间的关系,评价实际资料是否符合回归模型假设,识 别异常点等。 残差图 以X或Y为横轴,残差为纵轴,或者相反,绘制的散点图,称为残 差图,残差有多种形式,如标准化残差,学生化残差,剔除残差等。 如果样本数据每一点的残差以零为中心,均匀地散布在零的两侧,不 呈现任何特殊的形状,则我们认为,该样本数据满足拟合该模型的前 提条件。 凝血酶数据的回归残差图 Y值 非线性回归 一般而言,在自然界的生命现象中呈绝对的线性关系并不多见。很多 情况下变量间的关系呈现非线性关系,此时,我们要采用非线性回归方法 来分析这种变量间的关系。 非线性回归要比线性回归更能充分地表达变量间的关系,而且现在常 用的统计软件包都能拟合非线性模型,所以非线性模型在当今显得越来越 重要。 对自变量进行某种变量变换,把变量间的曲线关系变换为符合线性 模型的关系,那么,就可以用线性模型的理论与计算方法来分析非线性 回归模型。 拟合非线性回归的常用方法---变换自变量 非线性回归 通过自变量的变换使非线性模型线性化---曲线直线化 非线性回归 如果是需对应变量进行变量变换,才能使非线性模型线性化,此时,不 能采用变量变换的方法使曲线直线化而进行线性回归分析。这种情况下,应 该采用非线性回归模型来拟合最佳模型。 原因 因为对应变量变换后,采用线性模型进行分析,最小二乘原则只能 保证变量变换后的应变量的残差平方和最小,而不能保证原始应变量 的残差平方和最小,而我们进行回归分析,主要的目的就是由自变量 值来预测应变量值,而且要求残差平方和 最小. * * 主要内容 回归的概念及回归分析的作用 简单线性回归 线性回归的应用 残差分析 非线性回归 案例讨论 Francis Galton(1822-1911) 回归概念的起源 回归的概念及回归分析的作用 Y因变量,响应变量或反应变量 dependent variable, response variable X自变量,解释变量 independent variable, explanatory variable 回归(regression)的概念 通过自变量(X)的数值来预测变量(Y)的均数值和个体值及其变异. 回归分析的作用 通过可测或易测的变量对未知或不可测量变 量的状态进行估计. 相关关系与确定性关系 确定性关系 即两变量间的函数关系 圆的周长与半径的关系: C=2?R 速度、时间与路程的关系: L=ST X与Y的函数关系: Y=a+bX 相关关系与确定性关系 非确定性关系 两变量在宏观上存在关系,但并未精确 到可以用函数关系来表达。 青少年身高与年龄的关系 年龄与血脂的关系 回归分析是用来研究非确定性关系的一种统计分析方法 身高与体重的关系 药物浓度与反应率的关系 体重与体表面积的关系 简单线性回归 simple linear regression 简单线性回归模型 simple linear regression model 其中Yi为第i个个体的反应变量值,Xi为其自变量值,?为回归 直线的截距参数,?为回归直线的斜率参数,?i为误差. 案例:对15名健康人测量其凝血酶浓度(X) 与凝血时间(Y),试分析X与Y间的关系? 假定X与Y符合上述线性模型,则第i个个体的凝血时间等于 其凝血酶浓度的?倍加上?,再加上一点随机误差?i 简单线性模型 线性回归方程 上述模型的参数是未知的,我们一般通

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档