高考数学一轮总复习教学课件第九章 统计、成对数据的统计分析第3节 成对数据的统计分析.pptx

高考数学一轮总复习教学课件第九章 统计、成对数据的统计分析第3节 成对数据的统计分析.pptx

  1. 1、本文档共72页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第3节成对数据的统计分析;[课程标准要求]

1.会作两个相关变量的数据的散点图,能根据最小二乘原理建立经验回归方程并进行预测,了解样本相关系数的统计含义和残差分析.2.了解独立性检验的基本思想,2×2列联表的统计意义,能对两个分类变量进行独立性检验.;积累·必备知识;1.成对数据的统计相关性

(1)正相关与负相关

从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现

的趋势,我们就称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现的趋势,则称这两个变量负相关.;(2)线性相关与曲线相关

一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在

附近,我们就称这两个变量线性相关.

一般地,如果两个变量具有性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.;(3)样本相关系数

①相关系数r的计算

变量x和变量y的样本相关系数r的计算公式如下:;②相关系数r的性质;2.一元线性回归模型及其应用

(1)一元线性回归模型;(2)一元线性回归模型参数的最小二乘估计;(3)判断回归模型的拟合效果

①残差分析法

对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为.画出残差图,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预报精度越高.;②决定系数(R2)法;对于线性与非线性回归模型,以上两个分析方法都适合.通过分析,可以决定选择哪一种函数模型更加合理.;(1)列联表:列出成对分类变量数据的的数据统计表称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为;(2)独立性检验

基于小概率值α的检验规则是:

当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;

当χ2xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.

这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.;下表给出了χ2独立性检验中几个常用的小概率??和相应的临界值;(1)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.

(2)根据χ2的值可以判断两个分类变量有关的可信程度,χ2越大,则两分类变量有关的把握越大.;1.通常|r|大于0.75时,认为两个变量有很强的线性相关性.;1.思考辨析(在括号内打“√”或“×”).

(1)相关关系与函数关系都是一种确定性的关系.()

(2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.();(4)用相关系数r来刻画回归效果,r越小,说明模型的拟合效果越好.

()

(5)在2×2列联表中,若|ad-bc|越小,说明两个分类变量之间关系越强.()

(6)事件X,Y关系越密切,则由观测数据计算得到的χ2的值越大.

();2.某机构为调查古诗词爱好者是否有性别差异,通过调查数据统计:在500名男生中有200名爱好古诗词,在400名女生中有300名爱好古诗词.若要确定是否有充分证据推断爱好古诗词与性别有关,下列最适合的统计方法是()

A.均值 B.方差

C.独立性检验 D.回归分析;解析:由题意可知,“爱好古诗词”与“性别”是两类变量,要确定是否有充分证据推断其有关,应用独立性检验判断.故选C.;3.一组样本数据:(1,y1),(2,y2),(3,y3),(4,y4),(m,y5),由最小二乘法求得经验回归方程为=5x-7,若y1+y2+y3+y4+y5=45,则实数m的值为()

A.5 B.6 C.7 D.8;4.(选择性必修第三册P138T2改编)根据变量Y和x的成对样本数据,;解析:对于A,残差与观测时间有线性关系,故A错误;对于B,残差的方差不是一个常数,随着观测时间变大而变小,故B错误;对于C,残差与观测时间是非线性关系,故C错误;对于D,残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,故D正确.故选D.;5.已知P(χ2≥6.635)=0.01,P(χ2≥10.828)=0.001.在检验30岁以上的人患胃病是否与生活无规律有关的过程中,某研究员搜集数据并计算得到χ2=7.235,则根据小概率值α=的χ2独立性检验,可认为30岁以上的人患胃病与生活无规律有关.;02;考点一成对数据的统计相关性的判断

[例1](1)(2024·广西南宁模拟)某统计部门对四组数据进行统计分析后,获

您可能关注的文档

文档评论(0)

159****6867 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档