- 1、本文档共55页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]10相关与回归分析
* * * * * (一)回归模型检验的种类 回归模型的检验包括理论意义检验、一级检验和二级检验。 理论意义检验主要涉及参数估计值的符号和取值区间,如果它们与实质性科学的理论以及人们的实践经验不相符,就说明模型不能很好的解释现实的现象。 一级检验/统计学检验:它是利用统计学中的抽样理论来检验样本回归方程的可靠性。具体又分为拟合程度评价和显著性检验。 二级检验/经济计量学检验:它是对标准线性回归模型的假定条件能否得到满足进行检验。具体包括序列相关检验、异方差性检验、多重共线性检验等。 * (二)回归模型的拟合程度的评价 所谓拟合程度,是指样本观测值聚集在样本回归线周围的紧密程度。 * 因变量 y 的取值是不同的,y 取值的这种波动称为离差。变差来源于两个方面: 由于自变量 x 的取值不同造成的; 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响。 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示。 * 总变差平方和 (SST) { 三个平方和的关系 2. 两端平方后求和有 从图上看有 SST = SSR + SSE 回归平方和 (SSR) { 残差平方和 (SSE) { * 三个平方和的意义 总平方和(SST) 反映因变量的 n 个观察值与其均值的总离差 回归平方和(SSR) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和。 残差平方和(SSE) 反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和。 * 判定系数 R2 将上式两边同除以SST,得: 显而易见,各个样本观测点与样本回归直线靠得越紧,SSR在SST中所占的比例就越大。因此,可定义这一比例为判定系数,即有: * 判定系数R2 的特征 判定系数R2具有非负性; 判定系数取值范围0 ≤R2 ≤ 1; 判定系数是样本观测值的函数,它也是一个统计量。 在一元线性回归模型中,决定系数是单相关系数的平方。 * 例:利用前例资料计算 * 估计标准误差 总体随机误差项的方差 :可以反映理论模型误差的大小。 数学上可以证明, 的无偏估计Se2可由下式给出: Se2的正平方根又叫做回归估计的标准误差。 * Se越小表明实际观测点与所拟合的样本回归线的离差程度越小,即回归线具有较强的代表性。反之,Se越大表明实际观测点与所拟合的样本回归线的离差程度越大,即回归线的代表性较差。 简化公式: * 例:用前例资料继续计算 已知:n=15, , , , 则有: * (三)显著性检验 回归系数的显著性检验 根据样本估计的结果对总体回归系数的有关假设进行检验 回归方程的显著性检验 检验自变量X和因变量Y之间的线性关系是否显著 * 1、回归系数的显著性检验 (1)提出假设 H0: b1 = 0 H1: b1 ? 0 (2)计算统计量 (3)决策 * 如前例: 提出假设 H0:b1 = 0 人口增长与年均需求量之间无线性关系 H1:b1 ? 0 人口增长与年均需求量之间有线性关系 计算检验的统计量 t=36.0072t???=2.201,拒绝H0,表明人口增长与年均需求量之间有线性关系 * 2、回归方程的显著性检验 (1)提出假设 (2)计算检验统计量F (3)决策 如前例 * (1)提出假设 (3)决策 ∴拒绝原假设,表明所建立的回归方程是显著的, 即该食品需求量与地区人口增长量之间的线性关系是显著的。 (2)计算检验统计量F * 五、一元线性回归模型预测 点预测 给定一个x值,预测y的取值 区间预测 平均值的区间预测/置信区间 对于x的一个给定值x0,求出y的平均值的区间估计 特定值的区间预测/预测区间 对于x的一个给定值x0,求出y的特定值的区间估计 * (一)点预测 点预测的基本公式: 前例中,当人口增长量为400千人时,可预测该食品的年需求量为: * (二)区间预测 1、y的平均值的置信区间为 * 例:假定已知人口增长量为200千人,要求利用上例中拟合的样本回归方程与有关数据,计算置信度为95%的该食品年平均需求量的置信区间。 解:将有关数据代入拟好的样本回归方程,可得: 已知: * 查t分布表可知:显著性水平为5%,自由度为13的双侧t检验的临界值是2.16。因此,当人口增长量为200千人时,置信度为95%的该食品年需求量的预测区间如下: 当人口增长量为200千人时,有95%的概率保证该食品的年平均需求量在1247.9到1324.3吨之间。 * (三)区间预测 2、y的特定值的预测区间为 * 例:假
您可能关注的文档
- [理化生]高考物理动量机械能计算题专练.doc
- [理化生]高考生物复习 从杂交育种到基因工程.ppt
- [理化生]高中物理学习秘籍.doc
- [理化生]高考物理重点知识专题总结.ppt
- [理化生]高中生物第一册绪论.ppt
- [理学]+MPLS培训课件.ppt
- [理学]009第九章 存款货币银行g114.ppt
- [理化生]高二第一学期物理.ppt
- [理学]01 函数.ppt
- [理学]003静力学-一般力系.ppt
- DeepSeek培训课件入门宝典:第2册 开发实战篇 .pptx
- 全面认识全过程人民民主-2024春形势与政策课件.pptx
- 2024春形势与政策-全面认识全过程人民民主.pptx
- 2025年春季学期形势与政策第二讲-中国经济行稳致远讲稿.docx
- 2024春形势与政策-铸牢中华民族共同体意识课件.pdf
- 2024春形势与政策-走好新时代科技自立自强之路课件 (2).pptx
- 2024春形势与政策-走好新时代科技自立自强之路课件.pptx
- 形势与政策学习指导教学-整套课件.pdf
- 2023年春季形势与政策讲稿第三讲-开创高质量发展新局面.pdf
- DeepSeek培训课件-清华大学-DeepSeek模型本地部署与应用构建.pptx
文档评论(0)