网站大量收购闲置独家精品文档,联系QQ:2885784924

概率论与数理统计A9.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
“回归” 一词的历史渊源 “回归”一词最早由Francis Galton引入。 十九世纪,英国生物学家兼统计学家高尔顿研究发现: 其中x表示父亲身高, y 表示成年儿子的身高(单位:英寸,1英寸=2.54厘米)。这表明子代的平均高度有向中心回归的意思,使得一段时间内人的身高相对稳定。之后回归分析的思想渗透到了数理统计的其它分支中。 §9.1回归分析的基本概念 例1 合金的强度y (×107Pa) 与合金中碳的含量x (%) 有关。为研究两个变量间的关系。首先是收集数据,我们把收集到的数据记为(xi,yi),i=1,2,?,n。本例中,我们收集到12组数据,列于表1中 表1 合金钢强度y与碳含量x的数据 为找出两个量间存在的回归函数的形式,可以画一张图:把每一对数(xi,yi)看成直角坐标系中的一个点,在图上画出n个点,称这张图为散点图,见右图。 从散点图我们发现12个点基本在一条直线附近,这说明两个变量之间有一个线性相关关系,这个相关关系可以表示为 这便是y关于x的一元线性回归的数据结构式。通常假定 在对未知参数作区间估计或假设检验时,还需要假定误差服从正态分布,即 显然假定(2)比假定(1)强 由于 ?0, ?1均未知,需要我们从收集到的数据(xi,yi),i=1,2,…,n,出发进行估计。在收集数据时,我们一般要求观察独立地进行, 即假定y1, y2,?, yn,相互独立。综合上述诸项假定,我们可以给出最简单、常用的一元线性回归的数学模型: 4 回归方程的显著性检验 在使用回归方程作进一步的分析以前,首先应对回归方程是否有意义进行判断。 如果?1=0,那么不管x如何变化,E(y)不随x的变化作线性变化,那么这时求得的一元线性回归方程就没有意义,称回归方程不显著。如果?1?0,E(y)随x的变化作线性变化,称回归方程是显著的。 综上,对回归方程是否有意义作判断就是要作如下的显著性检验:H0:?1=0 vs H1: ?1?0 拒绝H0表示回归方程是显著的。 4.非线性化 , , , , S型曲线 6 倒指数函数 5 对数函数 4 指数函数 3 幂函数 2 双曲函数 1 变换后的线性式 变换 曲线 配曲线的一般方法是: 例9.3.1 一只红铃虫的产卵数Y和温度x有关.经观测获得一组红铃虫产卵数与温度的数据如下表所示.试求Y关于x的回归方程. 325 115 66 24 21 11 7 产卵数y 35 32 29 27 25 23 21 温度x/℃ 7 6 5 4 3 2 1 编号 解 1.根据这组数据画出散点图. 2.选择模型 作变换 于是得到 3.线性化 5.7838 4.7449 4.1897 3.1781 3.0445 2.3979 1.9459 35 32 29 27 25 23 21 x 7 6 5 4 3 2 1 编号 根据这些数据可算得 与 的最小二乘估计.经计算 于是得U关于x的回归方程 化为Y关于x的回归方程为 * §9.1 回归分析的概念 §9.2 一元线性回归 §9.3 可线性化的一元非线性回归 §9.4 单因素试验方差分析 回归分析及方差分析 Ch9 变量之间的关系 确定性关系 非确定性关系(相关关系) 对变量间统计依赖关系的考察主要是通过相关分析 (correlation analysis)或回归分析(regression analysis) 来完成的。 对于相关关系,虽然不能求出变量之间精确的函数关系式, 但是通过大量的观测数据,可以发现它们之间存在一定的 统计规律性。 回归分析是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。 分为:一元线性回归、多元线性回归、可线性化的非线性归 (双曲线、指数、对数、二次、幂函数等) 基本方法 考察随机变量Y与普通变量x之间的相关关系. 例1.在农业生产中小麦的亩产量Y与所施肥料量x有一定关系, 在一定范围内,若施肥量大,亩产也较高。 问题: Y是怎样依赖施肥料量x的变化的。 问题的特征: x是普通变量, Y是随机变量. 处理方法: 按数理统计处理问题的方法。 (1) 先进行一些试验, 分别取不同的值 Y也得到 个相应观察值 得到n对数据对,称为样本数据点 (2) 散点图 Y x o · · · · · · · · · · · · · · · · · · · · (3) 寻找Y与x的数量关系: 其中 一般地, ,

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档