- 1、本文档共78页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
专题三 统计预测
专题三 统计预测 一、一元线性回归分析(linear regression) 二、多元线性回归分析 三、曲线估计 四、时间序列分析 一、一元线性回归分析 1.建立回归方程:y=a+bx+ui a为常数项,b为回归系数,ui为剩余残差项或称为随机扰动项 2.估计参数a和b,可以用最小二乘法,也可以用计算机程序 一、一元线性回归分析 3.进行检验 目的:检验样本观察点聚集在回归直线周围的密集程度,评价回归方程对样本数据点的拟和程度。 1) 计算标准误差 标准误差为估计值与因变量间的平均平方误差 2)计算判定系数 R2,越接近1,回归拟合越好。 3)相关系数r检验 4)回归系数的显著性检验(t检验) T检验法 T服从自由度为n-2的T分布。Spss操作中将根据检验统计量自动计算统计量的观测值和对应的概率p值,p<0.05则回归系数显著(95%的置信区间) 5)F检验法 F服从自由度为(1,n-2)的F分布。Spss操作中将根据检验统计量自动计算统计量的观测值和对应的概率p值,p<0.05即可(95%的置信区间)。 (一元回归中,F检验与t检验一致,即: F=t2,两种检验可以相互替代) 4.进行预测 点预测和区间预测 区间预测 给出一个在一定概率保证程度下的预测置信区间 置信区间=y预测值±tSE t为某概率保证程度下的t值,查t检验临界值表即可,查表时,f等于n-k,n为观测值个数,k为变量个数; SE为标准误差 如概率保证度为95%,则 置信区间=y预测值±t0.05SE,n=10,变量个数为2,则查表得t=2.306,则 置信区间=y预测值±2.306×SE 2. 应用SPSS的步骤 1. File-open-data,选择已建好的excel表,注意该表一定要关闭(见珠江三角洲1996-2004年主要经济指标) 2. analyze-regression-linear,弹出对话框。 dependent:因变量,年末耕地面积;independent,自变量,国内生产总值 。 3.method:enter 4.Statistics 按钮,描述的统计量 5.options, 选项 7.save 一元回归分析例题应用一元回归分析预测珠三角耕地面积,自变量选择国内生产总值数据见表格珠江三角洲1996-2004年主要经济指标描述性统计量mean:平均值std.deviation:标准差N:例数 相关系数结果国内生产总值与年末耕地面积的相关系数为-0.864,相关系数单尾检验值为0.001,小于0.05,表明二者之间有较强的相关性。 模型摘要R:两者的相关系数为0.864R Square :判定系数为0.747Adjusted R Square :调整判定系数为0.711Std.Errorof the Estimate:估计值的标准误差为2.37 方差分析Mean Square:回归的均方为116.087,剩余均方为5.617,F检验统计量的观察值为20.667,sig:相应的概率p值为0.003,小于0.05,可以认为二者之间存在线性相关。 回归系数constant:常数项为85.457,回归系数B为-0.001,回归参数的标准误差为0,回归系数T检验的t统计量观察值为-4.546,T检验的概率p值为0.003,小于0.05,所以回归系数具有显著意义。预测模型为:y耕地=85.457-0.001X国内生产总值 二、多元回归分析 1.多元线性回归方程 多元回归方程:y=β0+β1x1+β2x2+...+βkxk,β1、β2、βk为偏回归系数。β1表示在其他自变量保持不变的情况下,自变量x1变动一个单位所引起的因变量y的平均变动 2.多元线性回归分析的主要问题 回归方程的检验 自变量筛选 多重共线性问题 3.多元线性回归方程的检验 (1)拟和优度检验 判定系数R2和调整的R2 判定系数R2越大,表示因变量与各个自变量的线性关系越强,即回归效果越好。 (2)回归方程的显著性检验: 1)目的:检验所有自变量与因变量之间的线性关系是否显著,是否可用线性模型来表示. 2)利用F检验,构造F统计量(置信区间为95%) F统计量对应的概值小于0.05 (3)回归系数的显著性检验 1)目的:检验每个自变量对因变量的线性影响是否显著,说明回归方程线性显著时每个回归变量对因变量的作用。 2)利用t检验,构造t统计量(置信区间为95% ) T检验的概率p值小于0.05,则显著。 4.多元线性回归分析中的自变量筛选 多元线性回归分析中的自变量筛选 (1)自变量筛选的目的 1)多元回归分析引入多个自变量. 如果引入的自变量个数较少
文档评论(0)