- 1、本文档共83页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 回归分析 邹昌文 回归分析的基本概念 问题的提出 确定性关系—一个变量由另一个或一组变量完全确定 如 非确定关系—一个变量同另一个或一组变量存在密切关系,但不存在确定关系(称为相关关系) 如人的身高和体重 施肥量与粮食产量 回归分析的定义 回归分析(Regression Analysis),就是研究变量之间的统计相关关系的一种方法,它从自变量和因变量的一组观测数据出发,寻找一个函数式,将变量之间的统计相关关系近似地表达出来。这个能够近似表达自变量与因变量之间关系的函数式,称为回归方程或回归函数 回归分析的内容 它是处理变量之间相关关系的一种数学方法 主要是研究如何建立回归模型,如何对回归模型进行统计分析和统计推断 研究的目的通常是预测,即用一个变量或一组变量预测或估计另一个变量 回归分析的基本思想 通过对自变量x与因变量y的均值之间的确定性关系y=f(x)研究x与y之间的不确定性关系 回归的来源见书p104 一元线性回归的数学模型 多元线性回归模型及参数的LS估计 回归分析的进一步讨论 非线性回归问题 最优回归方程的选择 回归诊断问题 非线性回归问题 最优回归方程的选择 变量的选择法 向后法 建立全模型 对每一个xi求检验值Fi 取Fi中最小的那个值,比如是Fk 如果Fk≧F出,则计算结束 如果FkF出,则从模型中剔除xk 回归诊断问题 线性回归模型的显著性检验 单个回归系数的显著性检验 剔除不显著自变量时,每次只宜剔除一个。先剔除Fi值最小的自变量,再重新作回归,重新检验,直到剩下的自变量对Y都有显著作用为止。 剔除不显著自变量的原则 例4.4.1 去碳量和三个因素的关系. 原问题 设自变量x与因变量y之间,有下列关系 广义线性回归中的加权处理 不能化为线性的非线性回归 问题 需用到非线性最优化方法求解 偏F检验法 在决定一个新的变量是否有必要进入模型,或判断某个变量是否可以从模型中删除时,可使用以下偏F检验 设其复相关系数为R 设其复相关系数为Ri 检验假设 有统计量 缺点:变量一旦被剔除就再也不会回到方程中去 T检验法 控制 是预测的反问题. 一元非线性回归 在实际问题中,Y与X常存在非线性关系,不能直接使用线性回归,但其中许多问题可转化为线性回归处理 1-6可用一元线性回归处理,7可用后面的多元线性回归方法处理。先用散点图看它更接近什么曲线,然后用相应方法处理。 例4.3.1 1)根据散点图,选择双曲线 2)取倒数后得到新的数据表 令 0.0929 0.0917 0.0943 0.0926 0.0943 0.0944 0.0953 v 0.0625 0.0667 0.0714 0.0769 0.0833 0.0909 0.1000 u 0.1001 0.1007 0.1000 0.1031 0.1053 0.1044 0.1220 0.1558 v 0.1111 0.1250 0.1429 0.1667 0.2000 0.2500 0.3333 0.5000 u 3)用相关系数检验法,取α=0.01,查表r 0.01(13)=0.641, 计算得 以上曲线并不一定是最佳的拟合曲线. 例4.3.2 2)根据散点图,选择倒指数曲线 2)取对数后得到新的数据表 2.3758 2.3888 2.3609 2.3795 2.3609 2.3599 2.3504 v 0.0625 0.0667 0.0714 0.0769 0.0833 0.0909 0.1000 u 2.3016 2.2956 2.3026 2.2721 2.2513 2.2597 2.1041 1.8594 v 0.1111 0.1250 0.1429 0.1667 0.2000 0.2500 0.3333 0.5000 u 计算得 用残差平方和表4.3.4作比较,后者拟合效果更好. 习题四p150 1. 3. 4. 7. 例:设 其中 试证下列恒等式 多元线性回归的数学模型 一元线性回归只有一个自变量,很多实际问题影响因素不止一个,有必要讨论多元线性回归. 称为多元线性回归模型 对x1,x2,…,xm,y进行n次观测,得到一组观测值: 即有方程组 记 则上述方程组可简写为 问题 已知数据矩阵 则有下列求导公式 得正规方程 残差平方和 又 LS估计量的性质 对一元线性回归,有 证(略) 又 多元线性回归的显著性检验 和一元线性回归一样,多元线性回归模型也需要进行显著性检验。多元线性回归显著性检验分为两步。一是模型的显著性检验;二是对每个变量Xi
文档评论(0)