网站大量收购独家精品文档,联系QQ:2885784924

第八章 带虚拟变量的回归预测技术(精品·公开课件).ppt

第八章 带虚拟变量的回归预测技术(精品·公开课件).ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 带虚拟变量的回归预测 第八章 带虚变量的回归预测技术 问题的引入 在前面讨论的回归模型中,我们所遇到的变量均为定量变量(可直接测度、数值性),例如GDP,工资,收入,受教育年数,销售额等。 在实际建模中,一些定性变量具有不可忽视的重要影响。例如,研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者的素质、不同的收入水平等是值得考虑的重要影响因素,但这些因素共同的特征是定性描述的。 在同时考虑定量和定性因素的条件下,依据现有的回归分析方法,如何对非定量因素进行回归分析呢? 采用“虚拟变量”对定性变量进行量化是一种思路。 8-1 虚拟变量 为解决上述非定量因素对模型精度的影响的问题,我们通常是采用引入“虚拟变量”来完成对这些因素的“量化”。 即根据这些因素的属性类型,构造只取“0”和“1”的人工变量,通常称为虚拟变量或哑元变量(dummy variables),通常记为D。 虚拟变量在模型中可以作解释变量, 也可以作因变量。 同时含有一般解释变量与虚拟解释变量的模型称为虚拟变量模型或协方差分析模型。 虚拟变量作因变量的模型又称抉择模型。 例1 研究学历和收入之间的关系,在你的样本中既有女性又有男性,你打算研究在此关系中性别是否会导致差别。 例2 研究某省家庭收入和支出的关系,采集的样本中既包括农村家庭,又包括城镇家庭,你打算研究二者的差别。 例3 研究通货膨胀的决定因素,在你的观测期中,有些年份政府实行了一项收入政策。你想检验该政策是否对通货膨胀产生影响。可以用两种方法来解决: 方法一:分别进行两类情况的回归,然后看参数是否不同。 方法二:用全部观测值作单一回归,将定性因素的影响用虚拟变量引入模型。 模型中引入虚拟变量的作用? 分离异常因素的影响, 例如分析我国GDP的时间序列,必须考虑“文革”因素对国民经济的破坏性影响, 剔除不可比的“文革”因素。 检验不同属性类型对因变量的作用, 例如工资模型中的文化程度、季节对销售额的影响。 提高模型的精度, 相当于将不同属性的样本合并, 扩大了样本容量(增加了误差自由度, 从而降低了误差方差)。 设置虚拟变量的原则 在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定: (1)若某定性因素有m 种互斥的属性类型,则模型应引入 m-1个虚拟变量。例如: 性别有2个互斥的属性, 引用2-1=1个虚拟变量; 文化程度分小学、初中、高中、大学、研究生5类, 引用4个虚拟变量。 (2)如果对 m 个状态引入 m 个虚拟变量来表示, 虚拟变量间会造成多重共线。 事实上 若在某研究中,需要考虑k个非定量因素,每个因素有mi种互斥属性,则在模型中应引入虚拟变量个数为: 8-2 虚拟变量回归模型及参数估计 8-2 虚拟变量回归模型及参数估计 一般虚拟变量回归模型 ANCOVA模型 回归模型的解释变量包括定量变量和定性变量,称这种回归模型为协方差分析模型(analysis-of-covariance models),其中定量变量称为协变量。 一个定量变量及多个定性变量的回归分析 例8-3:想了解美国51个地区公立学校教师薪水是否有显著差异。 pay : 公立学校教师平均年薪水平 ; pps : 政府机构用于每个学生的花费 地区: 1—东北和中北部地区 2—南部地区 3—西部地区 设两个虚拟变量D2和D3: 建立ANCOVA模型,则有 变量的交互影响 例8-4:能源问题:下表是某国1966年~1979年能源需求与相应GDP的数据资料 Y与X的散点图如下: 虚拟变量模型的分类 例8-5:考察1990年前后的中国居民的总储蓄——收入关系是否已发生变化。 下表中给出了中国1979~2001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据。 以Y为储蓄,X为收入,可令: 1990年前:Yi=?1+?2Xi+?1i i=1,2…,n1 1990年后:Yi=?1+?2Xi+?2i i=1,2…,n2 则有可能出现下述四种情况中的一种: (1) ?1=?1 ,且?2=?2 ,即两个回归相同,称为重合回归(Coincident Regressions); (2) ?1??1 ,但?2=?2 ,即两个回归的差异仅在其截距,称为平行回归(Parallel Regressions); (3) ?1=?1 ,但?2??2 ,即两个回归的差异仅在其斜率,称为汇合回归(Concurrent Regressions); (4) ?1??1,且?2??2 ,即两个回归完全不同,称为相异回归(Dissimilar Regressions)。 将n1

文档评论(0)

秦圈圈 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档