网站大量收购闲置独家精品文档,联系QQ:2885784924

第五讲 相关分析.ppt

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五讲 相关分析

第十章 相关分析 10.1 相关分析的概念和相关分析过程 10.2 两个变量间的相关分析 10.3 偏相关分析 10.4 距离分析 10.1.1相关分析的概念 研究变量间密切程度的一种常用统计方法 1、线性相关分析:研究两个变量间线性关系的程度。用相关系数r来描述。(详见下面) 2、偏相关分析:它描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性,如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系 3、相似性测度:两个或若干个变量、两个或两组观测量之间的关系有时也可以用相似性或不相似性来描述。相似性测度用大值表示很相似,而不相似性用距离或不相似性来描述,大值表示相差甚远 线性相关分析 研究两个变量间线性关系的程度。相关系数是描述这种线性关系程度和方向的统计量,用r表示。 如果变量Y与X间是函数关系,则r=1或r=-1;如果变量Y与X间是统计关系,则-1r1, 如果x,y变化的方向一致,如身高与体重的关系,则称为正相关,r0,如果x,y变化的方向相反,如吸烟与肺功能的关系,则称为负相关,r0; 而r=0表示无线性相关,一般地, |r|0.95 存在显著性相关; |r|?0.8 高度相关; 0.5? |r|0.8 中度相关; 0.3? |r|0.5 低度相关; |r|0.3 关系极弱,认为不相关 线性相关分析(续) 相关系数的计算有三种:Pearson、Spearman和Kendall Pearson相关系数:对定距变量的数据进行计算,公式P207 Spearman和Kendall相关系数:对分类变量的数据或变量值的分布明显非正态或分布不明时,计算时先对离散数据进行排序或对定距变量值排(求)秩。公式P208 10.1.2 相关分析的SPSS过程 在Analyze+Correlate下的三个子菜单: 1、Bivariate--相关分析,计算指定的两个变量间的相关关系,可选择Pearson相关、Spearman和Kendall 相关;同时对相关系数进行检验,检验的零假设为:相关系数为0(不相关)。给出相关系数为0的概率 2、Partial -- 偏相关分析,计算两个变量间在控制了其他变量的影响下的相关关系,对相关系数也进行检验,检验的零假设为:相关系数为0 3、Distance-- 相似性测度,对变量或观测量进行相似性或不相似性测度 10.2 两个变量间的相关分析 两两变量间的相关:包括两个连续变量间的相关(Pearson相关)和两个等级(分类)变量间的秩相关(Spearman和Kendall 相关) 菜单:Analyze+Correlate+Bivariate a、连续变量间的相关:Pearson。 P210 Data10-01:1962年-1988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的线性相关分析(income:国民收入,deposit:城乡居民储蓄存款余额,number:序号,year:年份)。比较有用的结果: Pearson相关系数r=.976和其相应的显著性概率Sig=.000(显然国民收入与存款余额之间是高度相关的) P211 Data07-03 银行职工的起始工资salbegin和现工资salary与雇员本人各方面条件的关系(年龄age、工作时间jobtime、以前工作经验prevexp):比较有用的结果: Pearson相关系数r和其相应的显著性概率Sig(Pearson相关系数均很小 ) 10.2 两个变量间的相关分析(续) b、等级(分类)变量间的秩相关:Spearman和Kendall。 P212 Data07-03 银行职工的起始工资salbegin和现工资salary与雇员的职务等级jobcat、受教育程度educ关系(比较有用的结果: Kendall秩相关系数r和其相应的显著性概率Sig(Kendall秩相关系数均.5,认为中度相关) P213 Data10-02 某次全国武术女子前10名运动员长拳和长兵器两项得分数据,要求分析这两项得分是否存在线性相关(比较有用的结果: 秩相关系数r和其相应的显著性概率Sig(秩相关系数均.5,认为中度相关) 10.3 偏相关分析的概念 P218 线性相关分析计算两个变量间的相关关系,分析两个变量间线性关系的程度。往往因为第三个变量的作用,使相关系数不能真正反映两个变量间的线性程度。如身高、体重与肺活量之间的关系。如果使用Pearson相关计算其相关系数,可以得出肺活量与身高和体重均存在较强的线性关系。但实际上,如果对体重相同的人,分析身高和肺活量,是否身高越高,肺活量就越大呢?不是的。原因是身高与体重有线性关系,体重与肺活量存在线性关系,因此得出身高和肺活量之间存在着较强的线性关系的错误结论。 偏相关分析的任务就是

文档评论(0)

f8r9t5c + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档