专题9.7 成对数据的统计分析(解析版).docxVIP

专题9.7 成对数据的统计分析(解析版).docx

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

专题9.7成对数据的统计分析

目录

TOC\o1-3\h\z\u题型一:依据散点图进行相关性的判断 3

题型二:一元线性回归模型 5

题型三:非线性回归模型 9

题型四:独立性检验的基本原理 15

题型五:独立性检验的实际应用 18

知识点总结

知识点总结

变量的相关关系

(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.

(2)相关关系的分类:正相关和负相关.

(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关.

样本相关系数

(1)r=eq\f(\i\su(i=1,n,)?xi-\x\to(x)??yi-\x\to(y)?,\r(\i\su(i=1,n,)?xi-\x\to(x)?2)\r(\i\su(i=1,n,)?yi-\x\to(y)?2)).

(2)当r0时,称成对样本数据正相关;当r0时,称成对样本数据负相关.

(3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.

一元线性回归模型

(1)我们将eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))称为y关于x的经验回归方程,其中eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\i\su(i=1,n,)?xi-\x\to(x)??yi-\x\to(y)?,\i\su(i=1,n,)?xi-\x\to(x)?2),,\o(a,\s\up6(^))=\x\to(y)-\o(b,\s\up6(^))\x\to(x).))

(2)残差:观测值减去预测值,称为残差.

列联表与独立性检验

(1)关于分类变量X和Y的抽样数据的2×2列联表:

X

Y

合计

Y=0

Y=1

X=0

a

b

a+b

X=1

c

d

c+d

合计

a+c

b+d

n=a+b+c+d

(2)计算随机变量χ2=eq\f(n?ad-bc?2,?a+b??c+d??a+c??b+d?),其中n=a+b+c+d,利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验.

α

0.1

0.05

0.01

0.005

0.001

2.706

3.841

6.635

7.879

10.828

【常用结论与知识拓展】

1.经验回归直线过点(eq\x\to(x),eq\x\to(y)).

2.求eq\o(b,\s\up6(^))时,常用公式eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2).

3.回归分析和独立性检验都是基于成对样本观测数据进行估计或推断,得出的结论都可能犯错误.

例题精讲

例题精讲

依据散点图进行相关性的判断

【要点讲解】依据散点图判断相关性的基本策略:(1)观察点的分布趋势,若点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关;(2)观察点的分布状态(形状),若点的分布成密集型带状区域且带状区域越“狭窄”,线性相关性越强;反之,线性相关性越弱.

张大爷种植了10亩小麦,每亩施肥千克,小麦总产量为千克,则

A.,之间有依赖关系 B.,之间有函数关系

C.是的函数 D.是的函数

【解答】解:小麦的总产量与种子、施肥量、水、日照时间等因素有相关关系,但不一定是函数关系.

故选:.

调查某种花萼长度和花瓣长度,所得数据如图所示,其中相关系数,下列说法正确的是

A.花瓣长度和花萼长度没有相关性

B.花瓣长度和花萼长度呈现负相关

C.花瓣长度和花萼长度呈现正相关

D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245

【解答】解:相关系数,且散点图呈左下角到右上角的带状分布,

花瓣长度和花萼长度呈正相关.

若从样本中抽取一部分,则这部分的相关系数不一定是0.8245.

故选:.

如图,5个数据,去掉后,下列说法正确的是

A.样本相关系数变小

B.残差平方和变大

C.决定系数变大

D.解释变量与响应变量的相关性变弱

【解答】解:由散点图可知,只有偏离直线最远,

当去掉后,和的相关性变强,且为正相关,

所以变大,变大,残差平方和变小.

故选:.

下列说法错误的是

A.决定系数越大,模型的拟合效果越好

B.若变量和之间的样本相关系数为,则变量和之间的负相关很强

C.残差平方和越小的模型,拟合的效果越好

D.在经验回归方

文档评论(0)

135****6560 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档