网站大量收购闲置独家精品文档,联系QQ:2885784924

1.1回归的基本思想及其初步应用概论.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.1回归的基本思想及其初步应用概论

必修3(第二章 统计)知识结构 收集数据 (随机抽样) 整理、分析数据估计、推断 简单随机抽样 分层抽样 系统抽样 用样本估计总体 变量间的相关关系 用样本的频率分布估计总体分布 用样本数字特征估计总体数字特征 线性回归分析 两个变量的关系 不相关 相关关系 函数关系 线性相关 非线性相关 问题1:现实生活中两个变量间的关系有哪些呢? 问题2:对于线性相关的两个变量用什么方法来刻划它们之间的关系呢? 最小二乘估计下的线性回归方程: 求根据一名女大学生的身高预报她的体重的 回归方程,并预报一名身高为172cm的女大 学生的体重。 例1 从某大学中随机选取8名女大学生,其身 高和体重数据如表所示: 体重/kg 身高/cm 解:由于问题中要求根据身高预报体重,因此 选取身高 为自变量 x,真实体重为因变量 y. 作散点图 问题:有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义。在怎样的情况下求得的 回归直线方程才有实际意义? 即建立的线性回归 模型是否合理? 如何对一组数据之 间的线性相关程度 作出定量分析? 需要对x,y 的线性相关 性进行检验 散点图只是形象地描述点的分布情况,它的“线性” 是否明显只能通过观察,要想把握其特征,必须进行定量的研究. 相关系数 1.计算公式 2.相关系数的性质 (1) |r|≤1. (2) |r| 越接近于1,相关程度越大;|r| 越接近 于0,相关程度越小. 思考: 产生随机误差e的原因是什么? 随机误差e的来源(可以推广到一般): 1、忽略了其它因素的影响:影响身高 y 的因素不只是体重 x,可能还包括遗传基因、饮食习惯、生长环境等因素; 2、用线性回归模型近似真实模型所引起的误差; 3、身高 y 的观测误差。 以上三项误差越小,说明我们的回归模型的拟 合效果越好。 函数模型与回归模型之间的差别 线性回归模型y=bx+a+e增加了随机误差项e,因 变量y的值由自变量x和随机误差项e共同确定,即自 变量x只能解析部分y的变化。 在统计中,我们也把自变量x称为解释变量,因 变量y称为预报变量。 59 43 61 64 54 50 57 48 体重/kg 编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 残差 -6.37 2.62 2.41 -4.61 1.137 6.62 -2.88 0.38 1.反映回归直线的拟合程度; 2.取值范围在 [ 0 , 1 ] 之间; 3. R2 ?1,说明回归方程拟合的越好;R2?0,说 明回归方程拟合的越差. 总的来说: 相关指数R2是度量模型拟 合效果的一种指标。在线 性模型中,它代表自变量 刻画预报变量的能力。 用身高预报体重时,需要注意下列问题: 1、回归方程只适用于我们所研究的样本的总体; 2、我们所建立的回归方程一般都有时间性; 3、样本采集的范围会影响回归方程的适用范围; 4、不能期望回归方程得到的预报值就是预报变量的精确值。事实上,它是预报变量的可能取值的平均值。 ——这些问题也适用于其它问题 建立回归模型的基本步骤是什么 ? 想一想? 选 变 量 画散点图 选 模 型 估计参数 分析和预测 被害棉花 红铃虫喜高温高湿,适宜各虫态发育的温度为 25一32C,相对湿度为80%一100%,低于 20C和高于35C卵不能孵化,相对湿度60% 以下成虫不产卵。冬季月平均气温低于一4.8 ℃时,红铃虫就不能越冬而被冻死。 1953年,18省发生红铃虫大灾害,受灾面积300万公顷,损失皮棉约二十万吨。 温度xoC 21 23 25 27 29 32 35 产卵数y/个 7 11 21 24 66 115 325 例2 现收集了一只红铃虫的产卵数y和温度x之间的7组观测数据列于下表: (1)试建立产卵数y与温度x之间的回归方程;并预测温度为28oC时产卵数目。 (2)你所建立的模型中温度在多大程度上解释了产卵数的变化? 选变量 解:选取气温为解释变量x,产卵 数为预报变量y。 画散点图 假设线性回归方程为 :?=bx+a 选 模 型 分析和预测 当x=28时,y =19.87×28-463.73≈ 93 估计参数 由计算器得:线性回归方程为y=19.87x-463.73 相关指数R2=r2≈0.8642=0.7464 所以,一次函数模型中温度解释了74.64%的产卵数变化。 0 50 100 150 200 250 300 350

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档