- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
STA333第18讲
STA333第18讲Spearman秩相关18.1简介在中,我们将讨论如何评估两项定量变量之间的关联(泛指为X和Y) 。通过“” ,X和Y之间的任何趋势例如,统计学家利用统计定量变量之间的关联程度被称为相关系数。。正如你想象,有参数的相关性和非参数相关性。所有具有以下属性:1 、范围在-1.0到+1.0之间2、相关系数表明两个变量完全负相关。 (有时,人们称此为“负相关” 。 )3相关系数表明两个变量是完全正相关。4 0表明,这两个变量不相关。(有时人们说,这两个变量是独立的。 )5相关性并不意味着因果关系!
18.2: Pearson相关和线性Pearson相关系数(通常表示为r)是最常见的的测量两个定量变量之间的关联程度参数方法。然而,它有一个限制:它X和Y之间线性:即,它会寻找一个直线关系。之前我介绍一个例子,,对于任何,收集的数据必须是形式,其中Xi是X的第i个样本的值,y的第i个样本。换句话说,你必须成对数据。这些数据华尔街日报。Video Board Tests公司进行的一项年度调查,采访20000名成年人要求他们说出看到、注意到、和最喜欢的最优秀的电视广告,并将这些广告挑选出来。留存印象调查是要求4000名普通的成年产品使用者说出在上周他们所看到的这些广告的产品类别。
变量spend是1983年的电视预算(单位:百万美元)是每周保留的展示次数(以百万) 。我们的目标是评估广告支出(通过留存的印象来衡量)。Pearson相关
我们想进行:
?绘制数据(例如它是线性的? ) 。? 。?进行假设检验,看看解决方案。 R中,这些步骤很容易。首先,一个: plot(milimp~spend, data=tvadyields,
+ main=Scatterplot of impression retention vs. ad budget)
我们可以看到,这似乎是一个弱(即,更多的广告似乎与) ,但。即如此,我们计算如下: attach(tvadyields) # 在R中打开数据
cor(milimp, spend, method=pearson)
[1] 0.6511683
我们得到 = 0.651 。这是一个中等强度的正线性相关。 (经常使用的经验法则是,) 。我们也可以Pearson相关假设检验。(’’rho’’)代表真正的未知的广告支出总体与广告留存印象之间的pearson相关系数,原假设 := 0 (即两个变量不是线性相关): 0 (双侧检验,说明两个变量线性相关): 0 (上尾测试,说明这两个变量是正线性相关): 0 (低尾测试,说明两个变量是负线性相关)在X和Y的假设下,通过使用t-检验来。在R: cor.test(milimp, spend, alternative=greater, method=pearson)
Pearsons product-moment correlation
data: milimp and spend
t = 3.74, df = 19, p-value = 0.0006937
alternative hypothesis: true correlation is greater than 0
检验统计量为t = 3.74的19个自由度,和p值是0.0007 ,所以我们可以拒绝H0自信地指出,广告支出和之间显著线性关联。这个方法是好的:1 ,如果X和/或Y不是正态分布?2,如果你的数据是顺序?3,如果X和Y是相关的,但不一定是线性的方式?非参数来救援!。考虑下面的数据:让我们用R来计算Pearson相关 x - c(0,2,3,4,6)
y - c(0,16,81,256,1296)
cor(x,y,method=pearson)
[1] 0.839785
1 、你如何解释这个结果呢?2 现在绘制数据。你看到了什么?这个的什么?这是通常的Pearson相关不一定说明整个。在上面的例子中的X和Y之间的相关性在某种意义上是完美......它只是不是线性的。Spearman秩相关是一种非参数的相关,其中X和Y之间的进行了。这实际上有一个优点:因为我们是“”了的之间的距离的概念,我们不会被锁定调查一个特定参数的关系(例如,一个线性的) 。因此,可以调查其他类型的关联强度。通过使用,我们调查X和Y之间关系这是我们所做的一切:排列X值。2排Y值。3使用原始数据值Pearson相关得到的相关系数为Spearman相关。
作为练习,使用上述数据做到这一点。Spearman相关?请问你的答案有意义吗?例如:电视广告收益。在R’’Spearman’’.
为了更加明确,:下面是结果: cor(milimp, spend, method=spearman)
[1] 0
您可能关注的文档
- 8个玄关好设计小空间放大微幸福.doc
- 8种食物能帮你疏通血管.docx
- a4第8课韩雅婷.doc
- =系统校正设计根轨迹法超前校正.doc
- 9款不同软装配饰呈现的中式风格书房.doc
- AD9.0布线注意事项及常用快捷键.doc
- AC黄铜接触片切割点焊机控制原理解析.doc
- AdverseSelectionandEconomicInstitu.doc
- AE操作流程命令.doc
- 9第24章人与环境.doc
- 2024年陕西省西安市雁塔区西安交大附属中学中中考五模化学试卷.doc
- 2024年陕西省西安市工业大学附属中学中考八模化学试卷.doc
- 2024年山西省忻州市定襄中学中考二模化学试卷.doc
- 2024年山西省运城市新绛县中考化学适应性试卷.doc
- 2024年山西省太原市中考二模理科综合试卷 —初中化学.doc
- 2024年山西省大同市多校中考联考二模化学试卷.doc
- 2024年新疆库尔勒市巴州二中中考一模考试化学试卷.doc
- 2024年陕西省西安市雁塔区交大附中中考三模化学试卷.doc
- 2024年陕西省咸阳市多校联考中考三模考试化学试卷.doc
- 2024年陕西省咸阳市永寿县部分学校中考模拟预测化学试卷.doc
文档评论(0)