SAS统计分析及应用(中国农大黄燕版)6相关与回归分析.ppt

SAS统计分析及应用(中国农大黄燕版)6相关与回归分析.ppt

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SAS统计分析及应用(中国农大黄燕版)6相关与回归分析

第6章 相关与回归分析 6.1 相关与回归分析概述 6.1.1 相关与回归分析的任务和种类 1. 相关与回归分析基本概念 相关分析(Correlation Analysis )是用来考察两变量间(x与y)的相互变化的关联关系。x与y的地位是平等的,两变量间没有因果关系。 回归分析(Regression Analysis)是研究一个或多个随机变量(称因变量)y1,y2,…yn与另一些变量(称自变量)x1,x2,…xk关系的统计方法。主要思想是用最小二乘法拟合因变量与自变量间的回归模型,从而把具有不确定关系的若干变量转化为有确定关系的方程模型来近似地分析,通过自变量的变化预测因变量的变化趋势。 2. 回归分析要解决的问题 当人们从一组对象上获得2个或多个指标的观测值时,往往需要回答下述几个问题: 1) 如何实现预测,即如何由1个或多个指标(自变量)的值去推算另1个或多个指标(因变量)的值。 2) 如何实现控制,即事先给出产品质量应达到的标准(自变量的取值范围),根据变量之间的数量关系去控制那些影响产品质量的因素(因变量)的变化区间。 3) 如何实现修匀,由于所研究的指标带有变异性,当用散布图将变量之间的关系呈现出来时,散点所形成的轨迹并非像数学中初等函数那样有规律,需要用合适的数学方法(如用直线或某种光滑曲线)对资料进行修匀,使变量之间本质联系更清楚地呈现出来。 3.相关分析的种类 实际工作中的相关问题主要包括线性相关(Linear Correlation)和秩相关(Rank Correlation),前者属于参数统计分析方法的范畴,后者则属于非参数统计分析方法。线性相关又称为简单相关(Simple Correlation),适用于双变量符合正态分布类型的数据。秩相关又称等级相关,适用于双变量等级资料类型的数据。具体来讲,秩相关分析方法适用于下列类型的资料: 不服从双变量正态分布而不宜做积差相关分析的数据。 总体分布类型未知的数据。 以等级表示的数据。 4.回归分析的种类 如果因变量是(非时间的)连续变量(即一般定量资料),设自变量的个数为k,当k=1时,回归分析的种类有: 直线回归分析。 通过直线化实现的简单曲线回归分析(以下简称为曲线拟合)。 非线性曲线拟合。 一般多项式曲线拟合。 正交多项式曲线拟合。 6.1.2 直线回归与相关分析 直线回归与相关分析方法的异同点 2.散点图在这两种分析中的作用 3.直线相关分析 4.直线回归分析 6.1.3 直线相关与回归分析的应用举例 6.2 相关、回归过程说明 6.2.1 CORR相关过程 PROC CORR 选择项 ; VAR 变量 ; WITH 变量 ; BY 变量 ; FREQ 变量 ; WEIGHT 变量 ; RUN ; 6.2.2 PLOT过程 PROC PLOT 选择项1 ; BY 变量 ; PLOT 垂直变量 * 水平变量 … / 选择项2 ; RUN ; 例6.3 SAS程序corr6_3.sas 此图为原始数据的散点图,纵轴为小麦结实率y,横轴为孕穗期平均温度x1、平均最低温度x2、抽穗期平均温度x3、平均最低温度x4,四个二维图重叠在一起,小麦结实率y与四个变量都有一定的相关性。 6.2.3 REG 回归过程 9.几点说明: 在REG回归分析过程中MODEL语句不能写成: model y=x1 x1*x1 ; REG过程不能产生新的变量,如想在回归模型中考虑变量的二次项x12(=x1*x1),必须使用DATA步创建数据集,或构造所需要的新变量来表示x1*x1 。 以上MODEL语句在PROC GLM中是有效的。 例6.4 小麦-玉米/花生间套作肥料试验,研究不同处理的施肥利润。变量说明:n:施氮肥量(kg/亩)、po:施磷肥量(kg/亩)、k:施钾肥量(kg/亩)、y:平均施肥利润(元/亩)。 分析平均施肥利润y与施氮肥量n、施磷肥量po、施钾肥量k之间的关系。 [SAS程序reg6_4.sas] 6.2.3 回归诊断方法 1.用条件数和方差分量来进行共线性诊断 各入选变量的共线性诊断借助SAS的MODEL语句的选择项COLLIN或COLLINOINT来完成。二者都给出数据矩阵的特征根和条件数(Condition Number),还以百分数的形式给出各变量的方差在各主成分上的分解(Decomposition),每个入选变量上的方差分量之和为1。COLLIN和COLLINOINT的区别在于后者对模型中截距项作了校正。当截距项有显著性时,看由COLLIN输出的结果;反之,应看由COLLI

文档评论(0)

rovend + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档