- 1、本文档共33页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
7直线相关与回归资料.ppt
直线相关与回归 变量间相互关系的密切程度和相关方向的分析称为相关分析;变量间数量上的依存关系的分析称为回归分析(即用回归方程表达变量间的数量关系的分析)。直线相关与回归分别是相关和回归分析中最简单的一种,故也称为简单相关与回归。他是研究两个变量间的相关关系与依存关系的统计方法。 第一节 直线相关 一、直线相关的概念 直线相关(linear correlation)是分析两个变量间是否存在线性相关关系的方法。适用于X与Y服从双变量正态分布的资料,双变量正态分布是指对每个确定的X,Y服从正态分布,且对每个确定的Y,X服从正态分布。直线相关的性质,可以用散点图说明。 例1.10名20岁男青年身高与前臂长测量数据如下: 作散点图观察X与Y之间的关系 。 根据散点图可以粗略的看出两个变量间相关的密切程度和相关方向。可分为以下几种情形: 正相关关系 二、相关系数的意义和计算 1.相关系数的意义 相关系数(correlation coefficient)是描述两个变量间相关关系的密切程度与相关方向的指标。总体相关系数用ρ 表示,样本相关系数用r 表示。? 样本相关系数的计算公式为: 2.相关系数的计算 2) 计算ΣX,ΣY,ΣX2,ΣY2,ΣXY。 三、相关系数的假设检验 前例所得相关系数r = 0.8227,是样本相关系数,由于存在抽样误差,要判断总体X、Y间是否有相关关系,就要对样本相关系数进行检验。相关系数的假设检验有两种方法: 1. t 检验: 以上例所得 r 值,检验20岁男青年身高与前臂长之间是否存在直线相关关系。 设 H0:两变量间无直线相关关系,ρ=0 H1:两变量间有直线相关关系,ρ≠0 α=0.05 第二节 直线回归 一、直线回归(linear regression)的概念 两个变量间的数量关系通常有两种,一种是确定性的关系,如圆周长与圆半径之间的关系,称为函数关系;另一种为非确定性的关系,如前述儿童年龄与体重之间的关系,只能估计出某一年龄儿童的平均体重大约是多少,这种关系即为回归关系。 描述两变量间的回归关系仍是用直线方程,为了区别于一般函数方程,我们将它称为直线回归方程(linear regression equation) 。直线回归方程的一般表达式为 式中 是由自变量 X 推算应变量 Y 的估计值,a、b 是决定直线的两个系数。a 为回归直线在 Y 轴上的截距(intercept),即 X = 0时的 Y 值。a 0表示直线与 Y 轴的交点在原点的上方;a 0,则交点在原点的下方;a = 0,则回归线通过原点。b 为样本回归系数(regression coefficient),即直线的斜率。b 0,表示直线从左下方走向右上方,即 Y 随 X 增大而增大;b 0,表示直线从左上方走向右下方,即 Y 随 X 增大而减小;b = 0,表示直线与 X 轴平行,即 X 与 Y 无直线关系。b 的统计学意义是 X 每变动一个单位,Y 平均变动 b 个单位。 二、直线回归方程的求法 根据数学上的最小二乘法原理,即使直线能满足各实测点至直线的纵向距离的平方和为最小,求解常数项a和回归系数b,其计算公式如下: 例2. 某地一年级12名女大学生的体重与肺活量数据如下,求两变量间的直线回归方程。 (2)求 、 、 、 、及 三、直线回归方程的图示 在自变量X的实测全距范围内任取相距较远且易读取的两X值,代入上式。 四、回归系数的假设检验 求得的回归方程是否成立,即X、Y是否有直线关系,是回归分析要考虑的首要问题。 我们知道即使X、Y的总体回归系数β为零,由于抽样误差,其样本回归系数b也不一定为零。因此需做β是否为零的假设检验,可用方差分析或t检验。 在讲述假设检验之前,先对应变量Y的离均差平方和作一分析。 (1)l yy的分析。 如图 ,P点的纵坐标被回归直线与均数截成三个线段: 上述三个线段的代数和为: 这里的P点是在散点图中任取的一点,若将全部点子都按上法处理,并将等式两端平方后再求和,则有: 上述三个平方和,各有其相应的自由度υ,并有如下的关系: υ总=υ回 + υ剩 υ总 = n - 1 ,υ回 = 1,υ剩 = n –2 式中n为样本例数。 (2)方差分析与t检验的基本思想。 方差分析的基本思想是:将SS总分解为SS回与SS剩两部分,然后按下式计算检验统
文档评论(0)