(1.9)--CH09 双变量回归与相关.ppt

(1.9)--CH09 双变量回归与相关.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共35页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

目录1第一节:直线回归2第二节:直线相关3第三节:秩相关4第四节:曲线拟合第九章双变量回归与相关

直线回归与直线相关的概念、应用条件、参数含义;最小二乘法概念;决定系数概念;秩相关概念与应用条件掌握熟悉了解直线回归的应用;回归与相关应用中应注意问题重点难点回归系数与相关系数的假设检验;回归与相关的区别与联系;曲线拟合一般方法第九章双变量回归与相关

第一节直线回归第九章双变量回归与相关

图注或图片来源(限人卫社图片)图9-110名健康成年人的年龄与血清总胆固醇含量散点图一、直线回归的概念在定量描述健康成年人血清总胆固醇含量与年龄数量上的依存关系时,将年龄称为自变量(independentvariable),用X表示;血清总胆固醇含量称为应变量(dependentvariable),也称因变量或反应变量,用Y表示。第一节直线回归

直线回归方程(linearregressionequation)总体间线性关系一、直线回归的概念第一节直线回归

回归方程的预测值(predictedvalue)常数项(constantterm),截距,X取0时Y的总体均数回归系数(coefficientofregression),斜率,X变化一个单位时Y的平均变化量=0时,Y与X无直线关系一、直线回归的概念第一节直线回归

第一节直线回归1.残差(residual)或剩余值Y的实测值与回归线上估计值的纵向距离2.最小二乘法(leastsquaresmethod)使各点残差平方和最小的回归系数所对应的直线二、直线回归方程的求法

第一节直线回归二、直线回归方程的求法编号年龄X血清总胆固醇含量Y1565.322323.213414.674515.035253.016353.577212.988473.939625.629名健康成年人的年龄X(岁)与血清总胆固醇含量Y(mmol/L)

第一节直线回归(一)回归方程的假设检验(二)总体回归系数的置信区间(三)利用回归方程进行估计和预测三、直线回归的统计推断

1.方差分析(1)平方和分解(2)自由度分解(3)F检验第一节直线回归图9-2平方和划分示意图(一)回归方程的假设检验

2.t检验第一节直线回归图9-3总体回归系数与样本回归系数的示意图回归系数标准误剩余数标准差

3.实例第一节直线回归即血清总胆固醇含量与年龄之间无直线关系即血清总胆固醇含量与年龄之间有直线关系变异来源自由度SSMSFP总变异88.511???回归17.6117.61159.4610.05残差70.9000.128??方差分析表按水准,拒绝,可认为血清总胆固醇含量与年龄之间有直线关系

本例中已计算得到:(二)总体回归系数的置信区间第一节直线回归按自由度查t界值表,得到代入上式计算得到区间:

(三)利用回归方程进行估计和预测第一节直线回归1.总体条件均数的置信区间条件均数的标准误估计值条件均数的置信区间

(三)利用回归方程进行估计和预测第一节直线回归2.个体值的预测区间个体Y值的标准差估计值个体值的预测区间图9-4mY|X的置信区间和个体值预测区间示意图

第二节直线相关第九章双变量回归与相关

图9-5直线相关示意图一、直线相关的概念直线相关(linearcorrelation)又称简单相关(simplecorrelation),用于双变量正态分布(bivariatenormaldistribution)资料。正相关负相关零相关完全相关第二节直线相关

图9-6新生儿黄疸患者血清总胆红素与胸骨正中部胆红素的散点图三、相关系数的意义与计算相关系数(correlationcoefficient)又称Pearson积差相关系数(coefficientofproduct-momentcorrelation)第二节直线相关

三、相关系数的统计推断第二节直线相关1.相关系数的假设检验可以认为新生儿黄疸患者血清总胆红素与胸骨正中部胆红素之间存在正相关关系。(直接查r界值表,得到相同结论)

三、相关系数的统计推断第二节直线相关2.相关系数的置信区间z变换z的正态近似法置信区间z的反变换血清总胆红素与胸骨正中部胆红素的总体相关系数95%置信区间为(0.456,0.946)

四、决定系数第二节直线相关取值在0到1之间且无单位,其数值大小反映了回归贡献的相对程度,也就是在Y的总变异中回归关系所能解释的百分比。回归平方和越接近Y的总离均差平方和,则r绝对值越接近1

文档评论(0)

158****6446 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档