线性回归方程(课件)高二数学(苏教版2019选择性必修第二册).pptxVIP

线性回归方程(课件)高二数学(苏教版2019选择性必修第二册).pptx

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

9.1.2线性回归方程

第9章统计

苏教版(2019)选择性必修第二册

一、一元线性回归模型

生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关,即父亲的身高较高时,儿子的身高通常也较高.为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如表8.2-1所示.

表8.2-1

编号

1

2

3

4

5

6

7

8

9

10

11

12

13

14

父亲身高/cm

174

170

173

169

182

172

180

172

168

166

182

173

164

180

儿子身高/cm

176

176

170

170

185

176

178

174

170

168

178

172

165

182

探究新知

利用前面表示数据的方法,以横轴表示父亲身高、纵轴表示儿子身高建立直角坐标系,再将表8.2-1中的成对样本数据表示为散点图,如图8.2-1所示.可以发现,散点大致分布在一条从左下角到右上角的直线附近,表明儿子身高和父亲身高线性相关.利用统计软件,求得样本相关系数为r≈0.886,表明儿子身高和父亲身高正线性相关,且相关程度较高.

图8.2-1

探究新知

思考:根据表8.2-1中的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?

在表8.2-1的数据中,存在父亲身高相同,而儿子身高不同的情况.例如,第6个和第8个观测的父亲身高均为172cm,而对应的儿子身高分别为176cm和174cm;同样,第3,4两个观测中,儿子身高都是170cm,而父亲身高分别为173cm和169cm.可见儿子身高和父亲身高之间不是函数关系,也就不能用函数模型刻画.

探究新知

探究新知

我们称(1)式为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.模型中的Y也是随机变量,其值虽然不能由变量x的值确定,但是却能表示为bx+a与e的和(叠加),前一部分由x所确定,后一部分是随机的.如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.

探究新知

二、一元线性回归模型随机误差的产生原因

在研究儿子身高与父亲身高的关系时,产生随机误差e的原因有:

(1)除父亲身高外,其他可能影响儿子身高的因素,比如母亲身高、生活环境、饮食习惯和锻炼时间等;

(2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差;

(3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,可以利用一元线性回归模型来近似这种关系,这种近似也是产生随机误差e的原因.

探究新知

三、经验回归方程

探究新知

探究新知

四、残差分析

一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析.借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.

探究新知

五、用R2比较模型的拟合效果

可以用决定系数R2来比较两个模型的拟合效果,R2的计算公式为

在R2表达式中,与经验回归方程无关,残差平方和

与经验回归方程有关.因此R2越大,表示残差平方和越小,即模型的拟合效果越好;R2越小,表示残差平方和越大,即模型的拟合效果越差.

探究新知

对R2的理解要注意以下三点

(1)在一元线性回归模型中,R2=r2,因此0≤R2≤1,且在一元线性模型中,R2和r都能刻画用线性回归模型拟合数据的效果,|r|越大,即R2越大,用线性回归模型拟合数据的效果就越好,即相关程度越强.

(2)当两个变量x,y非线性相关时,用拟合系数R2判断拟合效果,R2越大,拟合效果越好.

(3)R2可以作为衡量任何模型拟合效果的一个指标,它越大,拟合效果越好.

探究新知

题型1线性回归分析

探究新知

解:(1)散点图如图

探究新知

探究新知

探究新知

(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系.

探究新知

探究新知

探究新知

探究新知

探究新知

探究新知

探究新知

探究新知

题型2非线性回归

探究新知

解:(1)作出散点图如下图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y=c1ec2x的周围,其中c1,c2为待定的参数.

探究新知

探究新知

探究新知

非线性回归问题的处理方法

(1)指数函数型y=ebx+a

①函数y=ebx+a的图

文档评论(0)

187****8802 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档