- 1、本文档共37页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
84第讲成对数据的统计分析
知识点一、变量间的相关关系知识梳理
1、变量之间的相关关系
当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相关关
系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的
作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对
它们的关系作出判断.
注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的
关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.
2、散点图
将样本中的n个数据点(x,y)(i=1,2,⋅⋅⋅,n)描在平面直角坐标系中,所得图形叫做散点图.
ii
根据散点图中点的分布可以直观地判断两个变量之间的关系.
(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我
们将它称为正相关,如图(1)所示;
(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我
们将它称为负相关,如图(2)所示.
3、相关系数
若相应于变量x的取值x,变量y的观测值为y(1≤i≤n),则变量x与y的相关系数r=
nini
(x-x)(y-y)xy-nxy
ni=1ini=ni=1iin,通常用r来衡量x与y之间的线性
222222
(x-x)(y-y)x-nxy-ny
i=1ii=1ii=1ii=1i
关系的强弱,r的范围为-1≤r≤1.
(1)当r0时,表示两个变量正相关;当r0时,表示两个变量负相关.
(2)r越接近1,表示两个变量的线性相关性越强;r越接近0,表示两个变量间几乎不存在
线性相关关系.当|r|=1时,所有数据点都在一条直线上.
(3)通常当r0.75时,认为两个变量具有很强的线性相关关系.
知识点二、线性回归
1、线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.
对于一组具有线性相关关系的数据(x,y),(x,y),⋯,(x,y),其回归方程y=bx+
1122nn
a的求法为
第3071页共3427页
nn
(x-x)(y-y)xy-nxy
i=1iii=1ii
b=n2=n22
(x-x)x-nx
i=1ii=1i
a=y-bxnn
11
其中,x=x,y=y,(x,y)称为样本点的中心.
ni=1ini=1i
2、残差分析
对于预报变量y,通过观测得到的数据称为观测值y,通过回归方程得
您可能关注的文档
- 第84讲:成对数据的统计分析(原卷版)-2025年高考数学必刷题5000题.pdf
- 第85讲 计数原理(解析版)-2025年高考数学必刷题5000题.pdf
- 第85讲:计数原理(原卷版)-2025年高考数学必刷题5000题.pdf
- 第86讲 排列与组合(解析版)-2025年高考数学必刷题5000题.pdf
- 第86讲:排列与组合(原卷版)-2025年高考数学必刷题5000题.pdf
- 第87讲:二项式定理(原卷版)-2025年高考数学必刷题5000题.pdf
- 第88讲 随机事件、频率与概率(解析版)-2025年高考数学必刷题5000题.pdf
- 第88讲:随机事件、频率与概率(原卷版)-2025年高考数学必刷题5000题.pdf
- 第89讲 古典概型与概率的基本性质(解析版)-2025年高考数学必刷题5000题.pdf
- 第89讲:古典概型与概率的基本性质(原卷版)-2025年高考数学必刷题5000题.pdf
文档评论(0)