- 1、本文档共63页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
常见的第九讲--回归与回归分析
第六章 回归和回归分析 6.1 相关分析概述 6.2 相关分析 6.3 多元线性回归 6.4 曲线回归 6.5 逐步回归 6.1 相关分析概述 1. 散点图 散点图是描述变量之间关系的一种直观方法。我们用坐标的横轴代表自变量X,纵轴代表因变量Y,每组数据(xi,yi)在坐标系中用一个点表示,由这些点形成的散点图描述了两个变量之间的大致关系,从中可以直观地看出变量之间的关系形态及关系强度。 图6-1 不同形态的散点图 (a) (b) (c) (d) 就两个变量而言,如果变量之间的关系近似地表现为一条直线,则称为线性相关,如图6-1(a)和(b);如果变量之间的关系近似地表现为一条曲线,则称为非线性相关或曲线相关;如图6-1(c);如果两个变量的观测点很分散,无任何规律,则表示变量之间没有相关关系,如图6-l(d)。 2. 相关系数 相关系数是对变量之间关系密切程度的度量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;总体相关系数的计算公式为: 其中COV(X,Y)为变量X和Y的协方差,D(X)和D(Y)分别为X和Y的方差。 若相关系数是根据样本数据计算的,则称为样本相关系数(简称为相关系数),记为r。样本相关系数的计算公式为: 一般情况下,总体相关系数ρ是未知的,我们通常是将样本相关系数r作为ρ的近似估计值。 相关系数r有如下性质: 1)相关系数的取值范围:–1 ≤ r ≤ 1,若0 r ≤ 1,表明X与Y之间存在正线性相关关系,若–1 ≤ r 0,表明X与Y之间存在负线性相关关系。 2)若r = 1,表明X与Y之间为完全正线性相关关系;若 r = –1,表明X与Y之间为完全负线性相关关系;若r = 0,说明二者之间不存在线性相关关系。 3)当–1 r 1时,为说明两个变量之间的线性关系的密切程度,通常将相关程度分为以下几种情况:当| r | ≥ 0.8时,可视为高度相关;0.5 ≤ | r | 0.8时,可视为中度相关;0.3 ≤ | r | 0.5时,视为低度相关;当| r | 0.3时,说明两个变量之间的相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数进行显著性检验的基础之上。 3. 相关系数的显著性检验 相关系数的显著性检验也就是检验总体相关系数是否显著为0,通常采用费歇尔(Fisher)提出的t分布检验,该检验可以用于小样本,也可以用于大样本。检验的具体步骤如下: 1) 提出假设:假设样本是从一个不相关的总体中随机抽取的,即 H0:ρ = 0;H1:ρ ≠ 0 2) 由样本观测值计算检验统计量: 的观测值t0和衡量观测结果极端性的p值: p = P{| t | ≥ | t0 |} = 2P{t ≥ |t0|} 3) 进行决策:比较p和检验水平?作判断:p ?,拒绝原假设H0;p ? ?,不能拒绝原假设H0。 6.2 相关分析 1 简单相关 2 偏相关 3 复相关 1 简单相关 二、简单相关系数r的显著性测验 PLOT的用法PLOT 纵轴变量 * 横轴变量 [= 变量][/选项]; 表 PLOT语句的选项 PLOT语句的注意事项 PLOT语句用以对两个变量绘制散点图,表达式中位置在前(在乘号“*”之前)的变量作为散点图的y轴,位置在后的变量作为散点图的x轴。 2 偏相关(Partial Correlation) 1.一级偏相关系数 2.二级偏相关系数 3 复相关(或多重相关) R的显著性测验 proc corr; /* 简单相关 */ proc corr; var x1 x2; partial x3; /* r12.3 */ proc corr; var x1 x3; partial x2; /* r13.2 */ run; 6.3多元线性回归 二、 线性回归模型(Line Regression model) 线性回归模型的一般形式为: Y = ?0 + ?1X1 + … + ?kXk + ? 其中,?0,?1,…?k,是未知的参数,?是不可
文档评论(0)