课件-14(回归分析的基本思想及其初步应用).ppt

课件-14(回归分析的基本思想及其初步应用).ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
思考:相关关系与函数关系有怎样的不同? 函数关系中的两个变量间是一种确定性关系 相关关系是一种非确定性关系 * 必修3(第二章 统计)知识结构 收集数据 (随机抽样) 整理、分析数据估计、推断 简单随机抽样 分层抽样 系统抽样 用样本估计总体 变量间的相关关系 用样本的频率分布估计总体分布 用样本数字特征估计总体数字特征 线性回归分析 1、两个变量的关系 不相关 相关关系 函数关系 线性相关 非线性相关 问题1:现实生活中两个变量间的关系有哪些呢? 相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。 函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般的情况 问题2:对于线性相关的两个变量用什么方法来刻划之间的关系呢? 2、最小二乘法估计 最小二乘法估计下的线性回归方程: 如何描述两个变量之间线性相关关系的强弱? 在《数学3》中,我们学习了用相关系数r来衡量两个变量 之间线性相关关系的方法。 相关系数r 相关关系的测度 (相关系数取值及其意义) -1.0 +1.0 0 -0.5 +0.5 完全负相关 无线性相关 完全正相关 负相关程度增加 r 正相关程度增加 对回归模型进行统计检验 假设身高和随机误差的不同不会对体重产生任何影响,那么所有人的体重将相同。在体重不受任何变量影响的假设下,设8名女大学生的体重都是她们的平均值, 即8个人的体重都为54.5kg。 54.5 54.5 54.5 54.5 54.5 54.5 54.5 54.5 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 思考P5: 预报变量(体重)的变化在多大程度上与解释变量(身高) 有关?在多大程度上与随机误差有关? 在散点图中,所有的点应该落在同一条水平直线上,但是观测到的数据并非如此。这就意味着预报变量(体重)的值受解释变量(身高)或随机误差的影响。 54.5kg 59 43 61 64 54 50 57 48 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 例如,编号为6的女大学生的体重并没有落在水平直线上, 她的体重为61kg。解释变量(身高)和随机误差共同把这 名学生的体重从54.5kg“推”到了61kg,相差6.5kg,所以 6.5kg是解释变量和随机误差的组合效应。 用这种方法可以对所有预报变量计算组合效应。 数学上,把每个效应(观测值减去总的平均值)的平方加 起来,即用 表示总的效应,称为总偏差平方和。 在例1中,总偏差平方和为354。 59 43 61 64 54 50 57 48 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 那么,在这个总的效应(总偏差平方和)中,有多少来自于 解释变量(身高)?有多少来自于随机误差? 在例1中,残差平方和约为128.361。 因此,数据点和它在回归直线上相应位置的差异 是随机误差的效应,称 为残差。 例如,编号为6的女大学生,计算随机误差的效应(残差)为: 对每名女大学生计算这个差异,然后分别将所得的值平方后加起来, 用数学符号表示为: 称为残差平方和, 它代表了随机误差的效应。 由于解释变量和随机误差的总效应(总偏差平方和)为354, 而随机误差的效应为128.361,所以解释变量的效应为 解释变量和随机误差的总效应(总偏差平方和) =解释变量的效应(回归平方和)+随机误差的效应(残差平方和) 354-128.361=225.639 这个值称为回归平方和。 我们可以用相关指数R2来刻画回归的效果,其计算公式是 显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。 在线性回归模型中,R2表示解释变量对预报变量变化的贡献率。 R2越接近1,表示回归的效果越好(因为R2越接近1,表示 解释变量和预报变量的线性相关性越强)。 如果某组数据可能采取几种不同回归方程进行回归分析, 则可以通过比较R2的值来做出选择,即选取R2较大的模型 作为这组数据的模型。 总的来说: 相关指数R2是度量模型拟合效果的一种指标。 在线性模型中,它代表自变量刻画预报变量的能力。 1 354 总计 0.36 128.361 随机误差 0.64

文档评论(0)

2518887 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档