《SAS应用基础6-2.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
相关分析 相关分析是讨论分析变量之间是否有明显相关关系的重要工具,主要用于测定两变量在数量关系上的密切程度和性质。 相关关系是指在一定范围内,一个变量任一取值xi,虽然没有另一变量的某个确定值yi与之对应,但却有一个特定的yi的条件概率分布与之对应,只要有这种关系存在,我们就称变量x,y有相关关系。 相关模型中,没有自变量与依变量的区别,不具有预测特性,仅表示两变量的偕同变异。 SAS系统的CORR过程能计算变量间的相关系数,包括Pearson,Spearman,Hoeffding,Kendall等相关系数及其他统计量。 三种相关系数 Pearson相关系数:线性相关系数。它一般用字母r表示. Kendallτ相关系数:把所有的样本点配对,看每一对中的x和y是否都增加来判断总体模式. Spearman秩相关系数:把点的坐标换成各自样本的秩. CORR 过程 一般格式: PROC CORR DATA=数据集名称 [选项]; VAR 变量表;/*列出相关矩阵上部出现的变量*/ [WITH变量表;] /*列出相关矩阵左侧出现的变量*/ [PARTIAL 变量表;] /*指明求偏相关时受控制的变量*/ [WEIGHT 变量;] [FREQ 变量;] [BY 变量;] RUN; 注意:在SAS分析家中Descriptive-Correlations…选项下,可交互式的完成corr过程。 CORR 过程示例 例:利用SCORE 数据集计算语文成绩与英语成绩的相关关系。程序如下: proc corr data=sasuser.score; var chinese english; run; 结果可以分为2 个部分,第1 部分是简单统计量,第2 部分是相关系数及其P 值。相关系数以矩阵的形式给出,变量与自身的相关系数当然为一,不为1 的地方,上面的值是相关系数,下面的是P 值。例如语文成绩与英语成绩的相关系数为0.72379,相关系数为0 的概率值为0.0015。 相关分析示例 某学校随机抽取18名学生,测定其智商(IQ),连同当年数学和语文成绩,数据见下表。 示例的SAS程序 data iq; input no math chinese IQ @@; cards; 1 78 83 95 2 84 76 100 3 61 70 100 4 52 58 75 5 93 82 105 6 89 78 97 7 98 89 110 8 98 95 120 9 65 61 76 10 73 75 92 11 48 53 61 12 45 43 60 13 67 70 88 14 75 78 96 15 95 97 125 16 88 92 113 17 99 92 125 18 81 88 102 run; 三种相关系数的说明 分析变量中两两之间的简单相关分析,用corr过程; 当两变量都服从正态分布时,计算pearson相关系数; 当变量不服从正态分布或为等级数据时,应采用Kendall或Spearman相关系数; Spearman相关可用于双向有序分类变量之间是否有关联的分析,也称为秩相关。 偏相关 去除第三个变量对两变量之间相关的影响 proc corr nosimple; var chinese; with math; run; proc corr nosimple; var math chinese; partial IQ; run; 回归分析 回归分析是统计分析的一项重要内容,它可以帮助我们找出变量之间的数量关系. SAS/STAT 中提供的关于回归的过程很多包括(REG )回归过程、(RSREG) 二次响应面回归过程、(ORTHOREG) 病态数据回归过程、(NLIN) 非线性回归过程、(TRANSREG)变换回归过程、(CALIS)线性结构方程和路径分析过程、(GLM) 一般线性回归过程、(GENMOD)广义线性回归过程等等。 一元线性回归模型 1:收集数据:n个样本点(x1 ,y1),(x2,y2), …, (xn,y n). 即(x i ,y i),i=1 ,2, …,n. 2:散点图scatter: 一元线性回归的概念与术语 y=?0+?1x+ε Y称为被解释变量,x称为解释变量 ε表示除x外,影响y的其他一切因素. ε (error, disturbance)是不可观测的,称为随机误差项或随机干扰项 y与x之间的关系用两部分来描述: a. 一部分?0+?1x ,由x的变化引起y变化 b.另一部分ε, 由除x外的其他一切因素引起y变化 ?1称为回归系数(slope) ?0 称为回归常数(intercept) 回归方程的参数估计 参数?0 , ?1的估计 方法:普通最小二乘估计 OLSE (ordinary least

文档评论(0)

jizi6339 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档