- 1、本文档共32页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第02讲成对数据的统计分析
目录
考点要求
考题统计
考情分析
(1)了解样本相关系数的统计含义.
(2)理解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题.
(3)会利用统计软件进行数据分析.
2023年上海卷第14题,4分
2023年天津卷第7题,5分
2023年甲卷(文)第19题,12分
2022年I卷第20题,12分
从近五年的全国卷的考查情况来看,本节是高考的热点,主要以解答题形式出现,经常与概率综合出题,一般难度为中等.也可能以选择题、填空题形式出现,难度不大.主要以应用题的方式出现,多与经济、生活实际相联系,需要在复杂的题目描述中找出数量关系,建立数学模型,并且运用数学模型解决实际问题.
知识点一、变量间的相关关系
1、变量之间的相关关系
当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断.
注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.
2、散点图
将样本中的个数据点描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点的分布可以直观地判断两个变量之间的关系.
(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关,如图(1)所示;
(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为负相关,如图(2)所示.
3、相关系数
若相应于变量的取值,变量的观测值为,则变量与的相关系数,通常用来衡量与之间的线性关系的强弱,的范围为.
(1)当时,表示两个变量正相关;当时,表示两个变量负相关.
(2)越接近,表示两个变量的线性相关性越强;越接近,表示两个变量间几乎不存在线性相关关系.当时,所有数据点都在一条直线上.
(3)通常当时,认为两个变量具有很强的线性相关关系.
知识点二、线性回归
1、线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的求法为
其中,,,(,)称为样本点的中心.
2、残差分析
对于预报变量,通过观测得到的数据称为观测值,通过回归方程得到的称为预测值,观测值减去预测值等于残差,称为相应于点的残差,即有.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
(1)残差图
通过残差分析,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.
(2)通过残差平方和分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;反之,不合适.
(3)相关指数
用相关指数来刻画回归的效果,其计算公式是:.
越接近于,说明残差的平方和越小,也表示回归的效果越好.
知识点三、非线性回归
解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换元将陌生的非线性回归方程化归转化为我们熟悉的线性回归方程.
求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,还原后即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误.
1、建立非线性回归模型的基本步骤:
(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);
(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二次函数、指数函数、对数函数、幂函数模型等);
(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;
(5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;
(6)消去新元,得到非线性回归方程;
(7)得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等.
知识点四、独立性检验
1、分类变量和列联表
(1)分类变量:
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的频数表称为列联表.
②2×2列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{,}和{,},其样本频数列联表(称为2×2列联表)为
总计
总计
从列表中,依据与的值可直观
您可能关注的文档
- 8.2圆的方程(精练)(原卷版).docx
- 8.3 列联表与独立性检验(五大题型)(解析版).docx
- 8.3 列联表与独立性检验(五大题型)(原卷版).docx
- 8.3.1分类变量与列联表(分层作业)-2022-2023学年高二数学同步备课系列(人教A版2019选修第三册)(解析版).docx
- 2021届高三数学(文理通用)一轮复习题型专题训练:函数的值域(二)(含解析).docx
- 2021届高三数学(文理通用)一轮复习题型专题训练:函数的值域(三)(含解析).docx
- 2021届高三数学(文理通用)一轮复习题型专题训练:函数的值域(一)(含解析).docx
- 2021届高三数学(文理通用)一轮复习题型专题训练:集合---集合的含义与表示(含解析).docx
- 2021届高三数学(文理通用)一轮复习题型专题训练:集合---集合的基本运算(二)(含解析).docx
- 2021届高三数学(文理通用)一轮复习题型专题训练:集合---集合的基本运算(一)(含解析).docx
- “健康中国”2025:医疗健康产业政策环境与市场前景展望报告.docx
- 2025年,农产品品牌建设资金申请报告,品牌建设与产业政策应用.docx
- 基于2025年医联体模式的医疗资源配置与医疗服务均等化路径.docx
- 2025年房地产营销渠道创新与品牌建设策略研究报告.docx
- 2025年食品加工行业智能化生产线规划与产品创新案例分析报告.docx
- 2025年在线医疗服务平台在医疗健康领域的数据分析与应用研究报告.docx
- 2025年远程医疗服务模式在远程病理诊断中的应用与市场前景.docx
- 2025年虚拟现实(VR)灾害应急演练与培训市场研究报告.docx
- 基于2025年视角的城市公园改造提升社会稳定风险评估专项报告.docx
- 2025年绿色建筑市场推广效果监测与评估报告.docx
最近下载
- (人教版2019选择性必修第三册)高中物理综合测试卷(原卷版+解析).docx VIP
- 2024年四川省德阳市中考物理试题卷(含答案).docx
- 2024年中考语文专题复习:非连续性文本阅读(含练习题及答案).docx
- 第八章《浮力》单元测试(含解析)2024-2025学年鲁科版物理八年级下学期.pdf VIP
- 铁路轨道车制动系统-研究所.ppt
- 2025年事业单位招聘考试公共基础知识专题复习讲义及训练:法律知识.pdf
- 关于创建“温馨校园”活动的实施方案.pdf
- 产后修复腹直肌护理.pptx VIP
- 辽宁协作校2024-2025学年度高三第二次模拟考英语试题(含答案).docx
- 产后康复-腹直肌分离.pptx VIP
文档评论(0)