网站大量收购闲置独家精品文档,联系QQ:2885784924

第5讲包含虚拟变量的回归.ppt

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5讲包含虚拟变量的回归

第五讲 包含虚拟变量的回归模型 * 什么是虚拟变量 回忆:变量的分类 定类变量(nominal/categorical variable) 定序变量(ordinal variable) 定距变量(interval variable) 在定类变量中,有一类变量的取值只有0,1两种情况,称之为虚拟变量(dummy variable),也称为二分变量(binary variable)。其中,赋值为0的一类称为对照组(reference group)或基准组(benchmark group) * 自变量包含虚拟变量的回归模型 自变量仅为虚拟变量 如果自变量仅为虚拟变量,称为方差分析模型(analysis-of-variance, ANOVA)。 * 自变量包含虚拟变量的回归模型 例题 教育与年薪 * 自变量包含虚拟变量的回归模型 虚拟变量有多种分类 例题:某年中国人均GDP的地区差异 east central west 东部 1 0 0 中部 0 1 0 西部 0 0 1 * 自变量包含虚拟变量的回归模型 例题 某年中国人均GDP的地区差异 * 自变量包含虚拟变量的回归模型 例题 某年中国人均GDP的地区差异 * 自变量包含虚拟变量的回归模型 自变量包括虚拟变量和定距变量(协方差模型,ANCOVA) 例题: * 例:考察1990年前后的中国居民的总储蓄-收入关系是否已发生变化。 表5.1.1中给出了中国1979-2001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据。 虚拟变量的引入 1990年前: Yi=?1+?2Xi+?1i i=1,2…,n1 1990年后: Yi=?1+?2Xi+?2i i=1,2…,n2 四种情况: ?1=?1 ,且?2=?2 ,即两个回归相同,称为重合回归(Coincident Regressions); ?1??1 ,但?2=?2 ,即两个回归的差异仅在其截距,称为平行回归(Parallel Regressions); ?1=?1 ,但?2??2 ,即两个回归的差异仅在其斜率,称为汇合回归(Concurrent Regressions); ?1??1,且?2??2 ,即两个回归完全不同,称为相异回归(Dissimilar Regressions)。 将n1与n2次观察值合并,并用以估计以下回归: Di为引入的虚拟变量: 可分别表示1990年后期与前期的储蓄函数。 * 具体的回归结果为: t (-6.11) (22.89) (4.33) (-2.55) 由?3与?4的t检验可知:参数显著地不等于0,强烈示出两个时期的回归是相异的,储蓄函数分别为: 1990年前: 1990年后: =0.9836 * 虚拟变量的引入 例如,进口消费品数量Y主要取决于国民收入X的多少,中国在改革开放前后,Y对X的回归关系明显不同。 * 则进口消费品的回归模型可建立如下: 可以t*=1979年为转折期,以1979年的国民收入Xt*为临界值,设如下虚拟变量: 虚拟变量的引入 OLS法得到该模型的回归方程为: 则两时期进口消费品函数分别为: 当tt*=1979年, 当t?t*=1979年, * 虚拟变量的设置原则 每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1,即如果有m个定性变量,只在模型中引入m-1个虚拟变量。 例 已知冷饮的销售量Y除受k种定量变量Xk的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只需引入三个虚拟变量即可: 则冷饮销售量的模型为: 在上述模型中,若再引入第四个虚拟变量: 则: 其矩阵形式为: 如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则式中的: 显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。 这就是所谓的“虚拟变量陷井”,应避免。 * 因变量为虚拟变量的回归模型 线性概率模型(linear probability model, LPM) * 因变量为虚拟变量的回归模型 线性概率模型存在的问题 误差项不服从正态分布 误差项的方差可能是不相同的 概率的不会随着自变量的变化呈现简单的线性关系 概率的估计值很可能小于0或大于1 * 例题 一个由容量为209的样本估计的解释CEO薪水的方程为 其中,Y表示年薪水平(单位:万元),X1表示年收入(单位:万元),X2表示公司股票收益(单位:万元);D1,D2和D3均为虚拟变量,分别表示金融业、消费品工业

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档