网站大量收购闲置独家精品文档,联系QQ:2885784924

(卫生统计学)第十二章简单回归分析.ppt

(卫生统计学)第十二章简单回归分析.ppt

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(卫生统计学)第十二章简单回归分析

第十二章 简单回归分析 第一节 简单线性回归 二、回归模型的前提假设 回归模型前提假设 三、回归参数的估计—最小二乘估计 离差参数 例12-1 结果 四、总体回归系数 β 的统计推断 (一)回归系数b的标准误 Sb (二)回归系数 β 的假设检验 (三) 直线回归系数β的可信区间 第二节 线性回归的应用 2.当x=x0固定时,对个体 y 的区间估计 利用回归方程进行预测 利用回归方程进行统计控制 (四)应用直线回归应注意问题 直线回归与直线相关的区别 直线回归与直线相关的联系 残差均方MSE和决定系数 r2 因变量总变异的分解 y的个体值和均值的可信区间 第四节 非线性回归 二、变换自变量实现线性回归的步骤 例12-2 X与因变量均值拟合不同回归模型的结果 * ( two variable regression analysis ) 要求: 1.掌握回归的应用条件和算法 2.掌握回归方程的应用 3.会用计算器处理回归问题 一、线性回归的概念及其统计描述 自变量 x 是精确可测的,因变量y是服从正态分布的随机变量 且: 1.线性性 (x与y呈线性关系) 2.独立性 (n个观测值是独立的) 3.正态性 (误差项εi是正态的, εi ~N(0,σ2) 4.等方差性 (无论x在什么范围取值,y 都具有相同的方差) 见图12-2 x1 x2 x3 x y μ1 μ2 μ3 图12-2 求法:利用最小二乘法原理( least square method)— 回归残差平方和最小 而 可在计算器上实现 17 … … … … 15 13 14 时间Y 0.7 … … … … 1.0 1.2 1.1 浓度x → → 14 → 1.1 → xD,yD DATA → AC → shift → 2 mode 开机 → … → … → … → DATA → 13 → xD,yD 1.2 例12-1 估计血液的凝血酶浓度(单位/毫升)x与凝固时间y的回归方程 理论上,tb=tr ( 见第十一章第一节,P210 ) 回归系数的区间估计为: 在例12-1中,估计总体回归系数的95%可信区间 在例12-1中 第一观测点x1=1.1,求 y 的均数的95%可信区间 1.当x=x0固定时,对估计值y的均数的区间估计 在例12-1中 第一观测点x1=1.1,求 y 的个体值的95%可信区间 详见表12-2 例 某地卫生防疫站研究10年来乙脑发病率(1/10万,预报量Y)与相应前一年7月份日照时间(小时,预报因子X)之间的数量关系,先将乙脑发病率作平方根反正弦变换: 1990年7月份日照时间X0=260小时,试估计1991年该地乙脑发病率(设α=0.05) 解:利用个体值的预测范围估计乙脑发病率 在一定 y 值的前提下,确定自变量 x 值的取值,方法同上。 例 某市环境监测站在某交通点连续测定30天,每天定时采样3次,测得大气中NO2 浓度y(mg/m3)与当时汽车流量x(辆/小时),共90对数据,求得 回归方程 若NO2的最大容许浓度为0.15mg/m3, 则汽车流量应如何控制?( α=0.05 ) 解:求单侧区间上限 1. 作回归分析要有实际意义; 2. 在回归分析之前,应先绘制散点图,观察点趋势; 3.当样本含量较大时,统计学检验的作用减弱; 4. 应用时,应以内插为主,适当外延; 5.自变量的选择: 原因型 容易测量的 变异小的 如:年龄、身高、体重、体表面积 区别 r 没有单位,b有单位;所以,相关系数与单位无关,回归系数与单位有关,且不能根据 b 的大小判断回归关系的密切程度; 相关表示相互关系,没有依存关系;而回归有依存关系; 对资料的要求不同: 当x和y都是随机的,可以进行相关和回归分析; 当y是随机的(x是控制的),理论上只能作回归而不能作相关分析; ? 联系 均表示线性关系; 符号相同:共变方向一致; 假设检验结果相同:是否存在共变关系; E(MSE)= σ2 扣除 x 影响后y 的变异 Y X P (X,Y) 回归贡献 残差(随机的) 总变异 个体值可信区间 均值可信区间 一、对自变量实施变换实现线性化 1.将观察数据(xi , yi)作散点图,观察点分布变化特点 2.选定恰当的变换公式 3.对变换后的数据用常规最小二乘法估计线性参数 4.一般拟合多个相近的模型,然后通过对各个模型的拟合优度评价挑选合适的模型

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档