- 1、本文档共41页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
思考:相关关系与函数关系有怎样的不同? 函数关系中的两个变量间是一种确定性关系 相关关系是一种非确定性关系 * 必修3(第二章 统计)知识结构 收集数据 (随机抽样) 整理、分析数据估计、推断 简单随机抽样 分层抽样 系统抽样 用样本估计总体 变量间的相关关系 用样本的频率分布估计总体分布 用样本数字特征估计总体数字特征 线性回归分析 1、两个变量的关系 不相关 相关关系 函数关系 线性相关 非线性相关 问题1:现实生活中两个变量间的关系有哪些呢? 相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。 函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般的情况 问题2:对于线性相关的两个变量用什么方法来刻划之间的关系呢? 2、最小二乘法估计 最小二乘法估计下的线性回归方程: 如何描述两个变量之间线性相关关系的强弱? 在《数学3》中,我们学习了用相关系数r来衡量两个变量 之间线性相关关系的方法。 相关系数r 相关关系的测度(相关系数取值及其意义) -1.0 +1.0 0 -0.5 +0.5 完全负相关 无线性相关 完全正相关 负相关程度增加 r 正相关程度增加 对回归模型进行统计检验 假设身高和随机误差的不同不会对体重产生任何影响,那么所有人的体重将相同。在体重不受任何变量影响的假设下,设8名女大学生的体重都是她们的平均值, 即8个人的体重都为54.5kg。 54.5 54.5 54.5 54.5 54.5 54.5 54.5 54.5 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 思考P5: 预报变量(体重)的变化在多大程度上与解释变量(身高) 有关?在多大程度上与随机误差有关? 在散点图中,所有的点应该落在同一条水平直线上,但是观测到的数据并非如此。这就意味着预报变量(体重)的值受解释变量(身高)或随机误差的影响。 54.5kg 59 43 61 64 54 50 57 48 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 例如,编号为6的女大学生的体重并没有落在水平直线上, 她的体重为61kg。解释变量(身高)和随机误差共同把这 名学生的体重从54.5kg“推”到了61kg,相差6.5kg,所以 6.5kg是解释变量和随机误差的组合效应。 用这种方法可以对所有预报变量计算组合效应。 数学上,把每个效应(观测值减去总的平均值)的平方加 起来,即用 表示总的效应,称为总偏差平方和。 在例1中,总偏差平方和为354。 59 43 61 64 54 50 57 48 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 那么,在这个总的效应(总偏差平方和)中,有多少来自于 解释变量(身高)?有多少来自于随机误差? 在例1中,残差平方和约为128.361。 因此,数据点和它在回归直线上相应位置的差异 是随机误差的效应,称 为残差。 例如,编号为6的女大学生,计算随机误差的效应(残差)为: 对每名女大学生计算这个差异,然后分别将所得的值平方后加起来, 用数学符号表示为: 称为残差平方和, 它代表了随机误差的效应。 由于解释变量和随机误差的总效应(总偏差平方和)为354, 而随机误差的效应为128.361,所以解释变量的效应为 解释变量和随机误差的总效应(总偏差平方和) =解释变量的效应(回归平方和)+随机误差的效应(残差平方和) 354-128.361=225.639 这个值称为回归平方和。 我们可以用相关指数R2来刻画回归的效果,其计算公式是 显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。 在线性回归模型中,R2表示解释变量对预报变量变化的贡献率。 R2越接近1,表示回归的效果越好(因为R2越接近1,表示 解释变量和预报变量的线性相关性越强)。 如果某组数据可能采取几种不同回归方程进行回归分析, 则可以通过比较R2的值来做出选择,即选取R2较大的模型 作为这组数据的模型。 总的来说: 相关指数R2是度量模型拟合效果的一种指标。 在线性模型中,它代表自变量刻画预报变量的能力。 1 354 总计 0.36 128.361 随机误差 0.64
您可能关注的文档
- 南昌瑶湖森林公园.pptx
- 请输入密码.ppt
- 南京市2010-2016年初中毕业生学业考试物理试题及答案.doc
- PPT模板 大白.ppt
- 博尔赫斯(7、8课时).ppt
- PPT要这样做才漂亮,专业级!.doc
- 读书交流--黄艳1.ppt
- PPT解决问题的策略.ppt
- 读书会—受众观.pptx
- 诺基亚系统及主要机型.pptx
- 2024学年第一学期浙江省精诚联盟10月联考高二物理试题含答案及解析.pdf
- 【山东卷】山东省泰安市2024-2025学年高三上学期11月期中考试(11.13-11.15)英语试卷含答案及解析.pdf
- 【浙江卷】浙江省杭州市四校联考2024-2025学年高一上学期10月月考英语试卷含答案及解析.pdf
- 西南大学附中高一10月月考生物试卷含答案及解析.pdf
- 辽宁省县域重点高中协作体2024~2025学年高一上学期10月质量监测试题历史试卷含答案及解析.pdf
- 基于多功能超疏水材料的海水淡化及油水分离研究.pdf
- FKBP5基因多态性与抚养方式对孤儿静息态脑功能的影响.pdf
- 《因明入正理论略抄及后疏》的研习与创作感受.pdf
- HIF-1α、SGK1在子宫内膜增生及子宫内膜癌孕激素抵抗中的表达和意义.pdf
- 初中信息科技大单元教学设计框架构建及应用研究--以《人工智能》大单元为例.pdf
文档评论(0)