STA333第18讲.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
STA333第18讲

STA333第18讲Spearman秩相关18.1简介在中,我们将讨论如何评估两项定量变量之间的关联(泛指为X和Y) 。通过“” ,X和Y之间的任何趋势例如,统计学家利用统计定量变量之间的关联程度被称为相关系数。。正如你想象,有参数的相关性和非参数相关性。所有具有以下属性:1 、范围在-1.0到+1.0之间2、相关系数表明两个变量完全负相关。 (有时,人们称此为“负相关” 。 ) 3相关系数表明两个变量是完全正相关。 4 0表明,这两个变量不相关。(有时人们说,这两个变量是独立的。 ) 5相关性并不意味着因果关系! 18.2: Pearson相关和线性Pearson相关系数(通常表示为r)是最常见的的测量两个定量变量之间的关联程度参数方法。然而,它有一个限制:它X和Y之间线性:即,它会寻找一个直线关系。之前我介绍一个例子,,对于任何,收集的数据必须是形式,其中Xi是X的第i个样本的值,y的第i个样本。换句话说,你必须成对数据。这些数据华尔街日报。Video Board Tests公司进行的一项年度调查,采访20000名成年人要求他们说出看到、注意到、和最喜欢的最优秀的电视广告,并将这些广告挑选出来。留存印象调查是要求4000名普通的成年产品使用者说出在上周他们所看到的这些广告的产品类别。 变量spend是1983年的电视预算(单位:百万美元)是每周保留的展示次数(以百万) 。我们的目标是评估广告支出(通过留存的印象来衡量)。Pearson相关 我们想进行: ?绘制数据(例如它是线性的? ) 。 ? 。 ?进行假设检验,看看解决方案。 R中,这些步骤很容易。首先,一个: plot(milimp~spend, data=tvadyields, + main=Scatterplot of impression retention vs. ad budget) 我们可以看到,这似乎是一个弱(即,更多的广告似乎与) ,但。即如此,我们计算如下: attach(tvadyields) # 在R中打开数据 cor(milimp, spend, method=pearson) [1] 0.6511683 我们得到 = 0.651 。这是一个中等强度的正线性相关。 (经常使用的经验法则是,) 。我们也可以Pearson相关假设检验。(’’rho’’)代表真正的未知的广告支出总体与广告留存印象之间的pearson相关系数,原假设 := 0 (即两个变量不是线性相关): 0 (双侧检验,说明两个变量线性相关) : 0 (上尾测试,说明这两个变量是正线性相关) : 0 (低尾测试,说明两个变量是负线性相关)在X和Y的假设下,通过使用t-检验来。在R: cor.test(milimp, spend, alternative=greater, method=pearson) Pearsons product-moment correlation data: milimp and spend t = 3.74, df = 19, p-value = 0.0006937 alternative hypothesis: true correlation is greater than 0 检验统计量为t = 3.74的19个自由度,和p值是0.0007 ,所以我们可以拒绝H0自信地指出,广告支出和之间显著线性关联。这个方法是好的:1 ,如果X和/或Y不是正态分布? 2,如果你的数据是顺序? 3,如果X和Y是相关的,但不一定是线性的方式?非参数来救援!。考虑下面的数据:让我们用R来计算Pearson相关 x - c(0,2,3,4,6) y - c(0,16,81,256,1296) cor(x,y,method=pearson) [1] 0.839785 1 、你如何解释这个结果呢? 2 现在绘制数据。你看到了什么?这个的什么?这是通常的Pearson相关不一定说明整个。在上面的例子中的X和Y之间的相关性在某种意义上是完美......它只是不是线性的。Spearman秩相关是一种非参数的相关,其中X和Y之间的进行了。这实际上有一个优点:因为我们是“”了的之间的距离的概念,我们不会被锁定调查一个特定参数的关系(例如,一个线性的) 。因此,可以调查其他类型的关联强度。通过使用,我们调查X和Y之间关系这是我们所做的一切:排列X值。 2排Y值。 3使用原始数据值Pearson相关得到的相关系数为Spearman相关。 作为练习,使用上述数据做到这一点。Spearman相关?请问你的答案有意义吗?例如:电视广告收益。在R’’Spearman’’. 为了更加明确,:下面是结果: cor(milimp, spend, method=spearman) [1] 0

文档评论(0)

cuotian + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档