网站大量收购独家精品文档,联系QQ:2885784924

[理学]10相关与回归分析.ppt

  1. 1、本文档共55页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]10相关与回归分析

* * * * * (一)回归模型检验的种类 回归模型的检验包括理论意义检验、一级检验和二级检验。 理论意义检验主要涉及参数估计值的符号和取值区间,如果它们与实质性科学的理论以及人们的实践经验不相符,就说明模型不能很好的解释现实的现象。 一级检验/统计学检验:它是利用统计学中的抽样理论来检验样本回归方程的可靠性。具体又分为拟合程度评价和显著性检验。 二级检验/经济计量学检验:它是对标准线性回归模型的假定条件能否得到满足进行检验。具体包括序列相关检验、异方差性检验、多重共线性检验等。 * (二)回归模型的拟合程度的评价 所谓拟合程度,是指样本观测值聚集在样本回归线周围的紧密程度。 * 因变量 y 的取值是不同的,y 取值的这种波动称为离差。变差来源于两个方面: 由于自变量 x 的取值不同造成的; 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响。 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示。 * 总变差平方和 (SST) { 三个平方和的关系 2. 两端平方后求和有 从图上看有 SST = SSR + SSE 回归平方和 (SSR) { 残差平方和 (SSE) { * 三个平方和的意义 总平方和(SST) 反映因变量的 n 个观察值与其均值的总离差 回归平方和(SSR) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和。 残差平方和(SSE) 反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和。 * 判定系数 R2 将上式两边同除以SST,得: 显而易见,各个样本观测点与样本回归直线靠得越紧,SSR在SST中所占的比例就越大。因此,可定义这一比例为判定系数,即有: * 判定系数R2 的特征 判定系数R2具有非负性; 判定系数取值范围0 ≤R2 ≤ 1; 判定系数是样本观测值的函数,它也是一个统计量。 在一元线性回归模型中,决定系数是单相关系数的平方。 * 例:利用前例资料计算 * 估计标准误差 总体随机误差项的方差 :可以反映理论模型误差的大小。 数学上可以证明, 的无偏估计Se2可由下式给出: Se2的正平方根又叫做回归估计的标准误差。 * Se越小表明实际观测点与所拟合的样本回归线的离差程度越小,即回归线具有较强的代表性。反之,Se越大表明实际观测点与所拟合的样本回归线的离差程度越大,即回归线的代表性较差。 简化公式: * 例:用前例资料继续计算 已知:n=15, , , , 则有: * (三)显著性检验 回归系数的显著性检验 根据样本估计的结果对总体回归系数的有关假设进行检验 回归方程的显著性检验 检验自变量X和因变量Y之间的线性关系是否显著 * 1、回归系数的显著性检验 (1)提出假设 H0: b1 = 0 H1: b1 ? 0 (2)计算统计量 (3)决策 * 如前例: 提出假设 H0:b1 = 0 人口增长与年均需求量之间无线性关系 H1:b1 ? 0 人口增长与年均需求量之间有线性关系 计算检验的统计量 t=36.0072t???=2.201,拒绝H0,表明人口增长与年均需求量之间有线性关系 * 2、回归方程的显著性检验 (1)提出假设 (2)计算检验统计量F (3)决策 如前例 * (1)提出假设 (3)决策 ∴拒绝原假设,表明所建立的回归方程是显著的, 即该食品需求量与地区人口增长量之间的线性关系是显著的。 (2)计算检验统计量F * 五、一元线性回归模型预测 点预测 给定一个x值,预测y的取值 区间预测 平均值的区间预测/置信区间 对于x的一个给定值x0,求出y的平均值的区间估计 特定值的区间预测/预测区间 对于x的一个给定值x0,求出y的特定值的区间估计 * (一)点预测 点预测的基本公式: 前例中,当人口增长量为400千人时,可预测该食品的年需求量为: * (二)区间预测 1、y的平均值的置信区间为 * 例:假定已知人口增长量为200千人,要求利用上例中拟合的样本回归方程与有关数据,计算置信度为95%的该食品年平均需求量的置信区间。 解:将有关数据代入拟好的样本回归方程,可得: 已知: * 查t分布表可知:显著性水平为5%,自由度为13的双侧t检验的临界值是2.16。因此,当人口增长量为200千人时,置信度为95%的该食品年需求量的预测区间如下: 当人口增长量为200千人时,有95%的概率保证该食品的年平均需求量在1247.9到1324.3吨之间。 * (三)区间预测 2、y的特定值的预测区间为 * 例:假

文档评论(0)

jiupshaieuk12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6212135231000003

1亿VIP精品文档

相关文档