- 1、本文档共31页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3.1.1回归分析的基本思想及其初步应用 (一) 人教A版选修2-3 第三章 问题1:现实生活中两个变量间的关系有哪些呢? 两个变量的关系 不相关 相关关系 函数关系 线性相关 非线性相关 函数关系是一种确定性关系 相关关系是一种非确定性关系 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. 正相关 负相关 问题2:研究线性相关的两个变量的基本步骤是什么? 问题3:求线性回归直线的基本方法是什么? 画散点图 求回归直线方程 用回归直线方程进行预报 ---------------最小二乘法 利用最小二乘法求回归直线的方程 C 【例1】某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据: 一、求线性回归方程 请问:广告费为9万元时,销售收入一定是129.4成元吗? 二、残差分析------刻画拟合效果的几种方式 1.残差 2.残差图 可以通过残差发现原始数据中的可疑数据,判断所建立模型的拟合程度.(研究残差的意义) 可利用图形来分析残差特性.作图时以纵坐标为残差,横坐标为样本的编号. 如残差比较均匀地落在水平的带状区域中,说明选用的模型比较合适.带状区域宽度越窄,模型拟合精度越高,回归方程的预报精度越高. 3.相关指数 利用相关指数R2来刻画回归的效果 R2越接近于1,表示回归的效果越好. R2 是常用的选择模型指标之一,在实际应用中应该尽量选择R2的回归模型。 R2取值越大,表示残差平方和越小,模型的拟合效果越好. 残差平方和 相关指数R2是 相关系数r的平方 链接 总体偏差平方和 练一练 r0时,表明两个变量正相关; r0时,表明两个变量负相关. 相关系数r衡量两个变量间线性相关关系的方法 r的绝对值越接近1,表面两个变量的线性相关性越强; r的绝对值越接近0,表面两个变量之间几乎不存在线性相关关系. 当r0.75时认为两个变量有很强的线性相关关系 补充《必修3》第92页阅读材料 如何刻画线性关系的强弱? 【命题意图】本题主要考查样本的相关系数,是简单题. 【解析】有题设知,这组样本数据完全正相关,故其相关系数为1,故选D. 返回 1.判一判(正确的打“√”,错误的打“×”) (1)残差平方和越小,线性回归方程的拟合效果越好. ( ) (2)在画两个变量的散点图时,预报变量在x轴上,解释变量在y轴上. ( ) (3)R2越接近于1,线性回归方程的拟合效果越好. ( ) √ × √ 2.做一做(请把正确的答案写在横线上) (1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为 . (2)在残差分析中,残差图的纵坐标为 . (3)如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于 ,解释变量和预报变量之间的相关系数等于 . 答案:正相关 答案:残差 3.在建立两个变量y与x的回归模型中,分别选择4个不同模 型,求出它们相对应的R2如表,则其中拟合效果最好的模型 是( ) A.模型1 B.模型2 C.模型3 D.模型4 0.23 0.49 0.85 0.67 R2 4 3 2 1 模型 B 例2.已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据: x 14 16 18 20 22 y 12 10 7 5 3 (1)求y对x的回归直线方程; (2)计算R2,并说明回归模型拟合效果的好坏. (2) 请试着作出对应的残差图 (4)求R2并说明模型的拟合效果 练一练 备用:某运动员训练次数与成绩之间的数据关系如下: ①作出散点图. ②求出回归方程. ③作出残差图,并说明选用的模型的拟合效果. ④计算R2,并说明选用的模型的拟合效果. 51 48 46 42 39 37 34 30 成绩y 50 46 44 39 37 35 33 30 次数x 练习册第47页例2 解析:①作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系. ② 所以 所以回归方程为 =1.041 5x-0.003 88. ③作残差图如图所示, 由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适. ④计算得R2≈0.9855,说明了该运动员的成绩的差异有98.55%是由训练次数引起的. 【延伸探究】在题(2)题设条件不变的情况下,试预测该运动员 训练47次及55次的成绩. 【解析】由上述分析可知,我们可用回归方程 =1.0415x- 0.00388作为该运动员成绩的预报值. 将x=47和x=55分别代入该方程可得y≈49和y≈57. 故预测该运动员训练47次和55次的成绩分别为4
文档评论(0)