- 1、本文档共40页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八节 虚拟变量
第8章 模型中的特殊解释变量 主要内容 一、为什么引入虚拟变量 二、用虚拟变量测量截距变动 三、测量斜率变动 四、分段线性回归 一、为什么引入虚拟变量 1.定量解释变量 诸如前几章介绍的,可以在取值范围内连续取值的解释变量,称作定量解释变量。如:人均收入,农产品收购量,等。 2.定性变量 如性别、民族、国籍、战争、自然灾害和政治体制等,只表示某种特征的存在与不存在,称作定性变量。 一、为什么引入虚拟变量 建立回归模型的过程中,被解释变量不仅受定量解释变量影响,有时还受一些诸如如性别、民族、国籍、战争、自然灾害和政治体制等定性变量的影响。 因此,当这些定性变量对被解释变量产生影响时,当然也应该包括在回归模型中。 一、为什么引入虚拟变量 3.如何将定性变量引入模型 由于定性变量通常表示的是某种特征或属性是否存在,如男性、女性,城市户口、非城市户口等,所以量化方法可采用取值为0或1。 可以用1表示该属性存在,0表示该属性不存在(也可相反)。 一、为什么引入虚拟变量 4.虚拟变量 上述这种取值为0或1的变量称作虚拟变量,用D(Dummy)表示。虚拟变量应用于模型中,对其回归系数的估计与检验方法与定量变量相同。 当一个定性变量含有m个类别时,应向模型引入 m-1个虚拟变量。 一、为什么引入虚拟变量 比如“性别”含男性与女性两个类别,所以当“性别”作解释变量时,应向模型引入一个虚拟变量。取值方式是: 一、为什么引入虚拟变量 再例如,定性变量“学历”还有四个类别,即大学学历、中学学历、小学学历和无学历。当“学历”作解释变量时,应向模型引入(4-1)三个虚拟变量,一种取值方式是: 一、为什么引入虚拟变量 5.虚拟变量注意事项 (1) 当定性变量含有m个类别时,模型不能引入m个虚拟变量。否则在虚拟变量间会产生完全多重共线性,无法估计回归参数。 例如:一年四季,取m=4个虚拟变量。 截距项对应的单位向量等于D1+D2+D3+D4。即出现完全多重共线性。 一、为什么引入虚拟变量 (2)把虚拟变量取值为0所对应的类别称作基础类别。 例如:按上面对“学历”的赋值方法,“无学历”为基础类别。 (3)当定性变量含有m个类别时,不能把虚拟变量的值设成如下形式: 一、为什么引入虚拟变量 (4)回归模型可以只用虚拟变量作解释变量,也可以用定量变量和虚拟变量一起作解释变量。 二、用虚拟变量测量截距变动 下面给出的模型都属于测量截距变动的模型。 二、用虚拟变量测量截距变动 例8.3 随机调查美国旧金山地区20个家庭的储蓄情况,拟建立年储蓄额Yi(千美元)对年收入Xi (千美元)的回归模型。 二、用虚拟变量测量截距变动 为研究不同住房状况家庭的储蓄情况,引入定性变量“住房状况”,用D表示。 虚拟变量D定义如下: 建立回归模型: 二、用虚拟变量测量截距变动 二、用虚拟变量测量截距变动 二、用虚拟变量测量截距变动 当模型不引入虚拟变量“住房状况”时,得回归方程如下: 二、用虚拟变量测量截距变动 引入虚拟变量后,不同住房状况的居民的储蓄明显具有不同的截距: 二、用虚拟变量测量截距变动 例8.4 季节影响 “季节”是在研究经济问题中常常遇到的定性因素。比如,酒、肉的销量在冬季要超过其他季节,而饮料的销量又以夏季为最大。当建立这类问题的计量模型时,就要考虑把“季节”因素引入模型。 由于一年有四个季节,所以这是一个含有四个类别的定性变量。应该向模型引入3个虚拟变量。 二、用虚拟变量测量截距变动 研究,1982年第1季度至1988年第4季度全国按季节市场用煤销售量,时间序列图如下 二、用虚拟变量测量截距变动 从上图看出,煤销售量随季节不同呈明显的周期性变化。给出三个虚拟变量,设: 二、用虚拟变量测量截距变动 二、用虚拟变量测量截距变动 现在考虑只加入一个虚拟变量D1,把季节因素分为第四季度和第一、二、三季度两类。 二、用虚拟变量测量截距变动 三、测量斜率变动 用虚拟变量还可以考察回归函数的斜率是否发生变化,来分析不同“类型”的不同斜率。 方法是在模型中加入定量变量与虚拟变量的乘积项: 设模型如下 按β2、β3是否为零,回归函数可有如下四种形式: 三、测量斜率变动 三、测量斜率变动 例2:利用中国进出口贸易总额数据(1950-1984)。试检验改革前后该时间序列的斜率是否发生变化。 定义虚拟变量D如
您可能关注的文档
- vmware vi3中的虚拟存储层技术白皮书.pdf
- vmware view 4桌面虚拟化运用(二)-----安装准备.doc
- vmware view 4桌面虚拟化运用(四)----- 安装view composer.doc
- vmware view 4桌面虚拟化运用(五)----- 安装xp源虚拟机.doc
- vmware view虚拟桌面创建实战.doc
- vmware view桌面虚拟化解决方法.doc
- vmware 虚拟网络图解.doc
- vmware_view桌面虚拟化解决方法实例.doc
- vmware9虚拟机安装macosxmountainlion1082详细.doc
- vmware虚拟化最佳实践跟规划.ppt
文档评论(0)