第3章_相关选读.ppt

  1. 1、本文档共95页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 相关分析 相关分析的任务,是揭示地理要素之间相互关系的密切程度。而地理要素之间相互关系密切程度的测定,主要是通过对相关系数的计算与检验来完成的。 本节主要内容: 两要素之间相关程度的测定 多要素间相关程度的测定 (一)相关系数的计算与检验 简单相关分析是对两个变量之间的相关程度进行分析。简单相关分析所用的指标称为简单相关系数,又称为Pearson(皮尔森)相关系数。 通常以ρ表示总体的相关系数,以r表示样本的相关系数 总体相关系数的定义式是: 其中,Cov(X,Y)是随机变量X 和Y 的协方差;Var(X)和Var(Y)分别为变量X 和Y 的方差。总体相关系数是反映两变量之间线性相关程度的一种特征值,表现为一个常数。 样本相关系数的计算 (3)由于相关系数是x和y标准化后的结果,因此简单相关系数是无量纲的。 (4)对x和y做线性变换后可能会改变他们之间相关系数的符号(相关的方向),但不会改变相关系数的值。 (5)相关系数能够度量两变量之间的线性关系,但并不是度量非线性关系的有效工具。 (6)样本相关系数是根据样本观测值计算的,抽取的样本不同,其具体的数值也会有所差异。样本相关系数是总体相关系数的一致估计量。 相关系数的检验 在X与Y都服从于正态分布,并且又有ρ=0的条件下,可以采用t检验来确定r的显著性。其步骤如下: 首先,计算相关系数r的t值: (二)秩相关系数的计算与检验 其中,di = (xi ? yi ) , x i 和i y 分别是两个变量按大小(或优劣等)排位的等级(称为秩),n 是样本的容量。 与简单相关系数类似,Spearman 等级相关系数的取值区间为:?1 ≤ r s ≤ 1 。 r s为正值时,存在正的等级相关, r s取负值时,存在负的等级相关。 r s =1,表明两个变量的等级完全相同,存在完全正相关。 r s =-1,表明两个变量的等级完全相反,存在完全的负相关。 Spearman 等级相关系数检验 Spearman 等级相关系数是根据一定的样本计算的。两个变量的总体是否存在显著的等级相关也需要进行检验。当样本容量n 大于20 时,可利用以下t 统计量,进行等级相关系数的显著性检验。 总体等级相关系服从自由度为(n-2)的t 分布。 在给定的显著水平α下,如按上式计算的t 值(或者p 值)大于临界值t α/ 2 (n ? 2) (或pα),则可以认为ρs 与0 显著差别,即两种现象(两个变量)的总体是否存在显著的等级相关。 SPSS将自动计算Spearman相关系数、t统计量的观测值和对应的概率p值。 (三)Kendall(肯德尔)的tau(τ)相关系数及其检验(了解) 所谓同序对是指变量大小顺序相同的两个样本观测值,即其X的等级高低顺序与Y的等级顺序相同,否则称为异序对; 所谓同分对是指等级相同的一对样本观测值,如果样本容量为n,则样本观测值两两组对的话一共可以有n(n-1)/2对。 一般情况下,tau-a是在没有同分对时采用,它表示同序对的数目与异序对的数目的差在全部可能对数中所占的比例。如果有同分对时常用tau-b和tau-c;如果X和Y的等级数相同,则可用tau-b,否则用tau-c。在SPSS中采用tau-b。 特别注意,对不同类型的变量应采用不同的相关系数来度量。 两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关分析的适用条件时,使用Spearman秩相关系数来描述. Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。 对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。Spearman相关系数的计算公式可以完全套用Spearman相关系数计算公式,但公式中的x和y用相应的秩次代替即可。 Kendall‘s tau-b等级相关系数:用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。 对相关的有序变量进行非参数相关检验; 取值范围在-1-1之间,此检验适合于正方

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档