- 1、本文档共129页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第讲相关分析与回归分析
在很多研究领域中,往往需要研究事物间的关系。如收入与受教育程度,子女身高与父母身高,商品销售额与广告费用支出,农作物产量与施肥量,上述两者间有关系吗?如果有关系,又是怎么样的关系呢?如何来度量这种关系的强弱? 解决上述问题的统计方法是相关 分析和回归分析。 相关分析和回归分析的共同点是都可推断两个变量间的统计相关性。但两者的区别是明显的,主要表现在: 1. 变量地位 在相关分析中,两个变量地位是对等的;但在回归分析中,一个变量是因变量,其余的变量均为自变量。 2. 变量类型 相关分析中的两个变量均为随机变量,而回归分析中的因变量是随机变量,但自变量可以是随机变量,也可以是非随机变量。 3. 研究目的 相关分析仅度量两个变量间的相关程度和方向,而回归分析则要进一 步建立因变量与所有自变量间的回归方程,即回归分析不仅推断自变量对因变量的影响程度,还可以根据回归方程进行预测和控制。 1. 概述 事物之间的关系可分为两类,一类是函数关系,另一类是相关关系。 所谓相关关系指的是两个变量间存在的一种不确定的数量关系,即一个变量的取值不能由另一个变量唯一确定。 相关分析研究的是相关关系。 相关分析主要研究线性相关关系,但也考察非线性相关关系。 下列不属于相关关系的是( )。 A. 产品成本与生产数量 B. 球的表面积与体积 C. 家庭的支出与收入 D. 人的年龄与体重 下列关系是线性相关的是( )。 A. 人的身高与视力 B. 圆心角大小与所对弧长 C. 收入水平与纳税水平 D. 父母平均身高与儿子身高 相关分析主要研究变量间是否相关及相关的密切程度与方向。 相关分析中最常用的是简单相关分析,即两个变量间的相关性。 三个及三个以上变量间的关系称为复相关,它研究的是一个因变量与两个及以上自变量间的关系。 通常,通过控制变量法将复相关转化为两个变量间的相关性,这种关系称为偏相关。 描述变量间相关性的常用统计指标是相关系数。除此之外,还可以通 过距离来描述变量间的关系,称之为距离相关分析。 下面分别介绍简单相关分析、偏相关分析和距离相关分析。 2. 简单相关分析 简单相关主要包括Pearson相关, Spearman相关和Kendall’s相关。 (1) Pearson相关系数 Pearson相关是简单相关分析中最常用的相关分析方法,其适用范围是: 连续数据; 正态分布; 线性关系。 Pearson(线性)相关系数r的性质: |r|≤1;r0 时正相关;r0 时负相关;r=0时不相关,即两变量间不存在线性相关关系,但可能存在其它形式的非线性关系。 |r|≥0.8时高度相关;0.5≤|r|0. 8时中度相关;0.3≤|r|0.5时低度相关;|r|0.3时基本不相关。 由于相关系数是用样本计算得到的,带有一定的随机性,所以用样本相关性估计总体相关性的可信度需要检验。 SPPS可以自动进行检验,并分 别用“*”,“**”标注显著性水平0.05, 0.01下的显著相关。 (2) Spearman和Kendall’s相关系数 Pearson相关系数属参数统计分析中的矩相关系数,有一定的局限性:当正态分布假设不成立时,检验结果不可信;只能度量线性相关性,不能描述非线性相关性。 Spearman和Kendall’s相关系数为非参数统计分析中的秩相关系数。 当正态分布假设不成立或分析非线性相关关系时,可考虑用上述两种相关系数。 但这两种相关系数最适合度量两排序变量间的相关性,对连续变量效果欠佳。 排序变量的取值可以表示某种顺序关系,如服务满意度取值1~5,分别表示非常不满意,不满意,一般满意,满意,非常满意。 例1 24位高水平数学家的年收入y与其研究成果指标x1,研究工作时间x2以及申请项目成功指标x3如下,分析年收入与三个指标的关系。 解 分析-相关-双变量-调入所有变量,默认“Pearson, 双侧检验, 标记显著性相关”。
文档评论(0)