第九章 双变量回归与相关课件.ppt

  1. 1、本文档共103页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第九章;双变量计量资料:每个个体有两个变量值

总体:无限或有限对变量值

样本:从总体随机抽取的n对变量值

(X1,Y1),(X2,Y2),…,(Xn,Yn)

目的:研究X和Y的数量关系

方法:回归与相关

简单、基本——直线回归、直线相关;Content

1.Linearregression

2.Linearcorrelation

3.Rankcorrelation

4.Curvefitting

;;儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系:

即高个子父代的子代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平,而矮个子父代的子代的平均身高不是更矮,而是稍高于其父代水平。Galton将这种趋向于种族稳定的现象称之“回归”。

;目前,“回归”已成为表示变量之间某种数量依存关系的统计学术语,并且衍生出“回归方程”“回归系数”等统计学概念。如研究糖尿病人血糖与其胰岛素水平的关系,研究儿童年龄与体重的关系等。;第一节直线回归;一、直线回归的概念;例9-1某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表9-1。估计尿肌酐含量(Y)对其年龄(X)的回归方程。

;表9-18名正常儿童的年龄(岁)与尿肌酐含量(mmol/24h);;在定量描述儿童年龄与其尿肌酐含量数量上的依存关系时,将年龄称为自变量(independentvariable),用X表示;尿肌酐含量称为应变量(dependentvariable),用Y表示。

;由图9-1可见,尿肌酐含量Y随年龄X增加而增大且呈直线趋势,但并非8个点子恰好全都在一直线上,此与两变量间严格的直线函数关系不同,称为直线回归(linearregression),其方程叫直线回归方程,以区别严格意义的直线方程。

双变量直线回归是回归分析中最基本、最简单的一种,故又称简单回归。

;直线回归方程的一般表达式为;1.a为回归直线在Y轴上的截距。;b0,直线从左下方走向右上方,Y随X增大而增大;

b0,直线从左上方走向右下方,Y随X增大而减小;

b=0,表示直线与X轴平行,X与Y无直线关系。;;;二、直线回归方程的求法;;第九章双变量回归与相关;例9-1某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表9-1。估计尿肌酐含量(Y)对其年龄(X)的回归方程。

;表9-18名正常儿童的年龄(岁)与尿肌酐含量(mmol/24h);解题步骤;第九章双变量回归与相关;第九章双变量回归与相关;此直线必然通过点(,)且与纵坐标轴相交于截距a。如果散点图没有从坐标系原点开始,可在自变量实测范围内远端取易于读数的X值代入回归方程得到一个点的坐标,连接此点与点(,)也可绘出回归直线。;;三、直线回归中的统计推断;(一)回归方程的假设检验;;第九章双变量回归与相关;1.方差分析;;数理统计可证明:

;上式用符号表示为;第九章双变量回归与相关;上述三个平方和,各有其相应的自由度,并有如下的关系:;如果两变量间总体回归关系确实存在,回归的贡献就要大于随机误差,大到何种程度时可以认为具有统计意义,可计算统计量F

;式中

;2.t检验;例9-2检验例9-1数据得到的直线回归方程是否成立?;(1)方差分析;表9-2方差分析表;(2)t检验;注意:

;(二)总体回归系数的可信区间;例9-3根据例9-1中所得b=0.1392,估计其总体回归系数的双侧95%可信区间。

;(0.1392-2.447×0.0304,0.1392+2.447×0.0304)

=(0.0648,0.2136);(三)利用回归方程进行估计和预测;(9-15);;;例9-4用例9-1所得直线回归方程,计算当X0=12时,的95%可信区间和相应个体值的95%预测区间。

;计算步骤;第九章双变量回归与相关;第二节直线相关;直线相关(linearcorrelation)又称简单相关(simplecorrelation),用于双变量正态分布(bivariatenormaldistribution)资料。其性质可由图9-6散点图直观的说明。

文档评论(0)

mwk365 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档