- 1、本文档共37页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
赵卫亚(回归模型的扩展虚拟变量部分)
城镇 农村 如果引入两个虚拟变量: 回归模型为: 对任意家庭都有: 产生完全多重共线性,陷入“虚拟变量陷阱” 虚拟变量陷阱的实质是:完全多重共线性 城镇 农村 农村 城镇 如果模型本身不含截距项,引入两个虚拟变量: 回归模型为: 不会产生产生完全多重共线性,即不会陷入“虚拟变量陷阱” 城镇 农村 农村 城镇 四、虚拟变量的应用 (1)调整季节波动 利用季度或月份资料建模时,经常存在季节波动。 处理方法 去除时间序列的季节、周期等效应,更清晰的反应变量之间的关系 利用虚拟变量方法反映季节因素的影响 三、虚拟变量的应用 (2)检验模型结构的稳定性(变化) 用途: 分析模型结构对样本变化的敏感性 比较两个或多个模型之间的差异情况 例如,不同性别人群消费函数是否相同?不同时期居民消费行为是否发生变化? 为什么不简单的将数据分成两段? 分组后观测值大大减少,有时观测值少到难以估计 无法对结构变化进行检验 (3)分段回归(略) 五、案例分析 第三章 回归模型的扩展之虚拟变量 第四节 虚拟变量模型 一、虚拟变量的概念 二、虚拟变量引入的方式 三、虚拟变量的引入原则 四、虚拟变量的应用 五、案例分析 一、虚拟变量的概念1、问题的引出 前面的回归模型中,所遇到的变量均为定量变量,如GDP、工资、收入、销售额,教育年数等。 实际建模,一些定性变量有不可忽视的影响。 例如,研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营,非私营)、地理位置(东、中、西部)等是值得考虑的因素。但这些因素是定性描述的。 2、基本概念 定量因素——可直接测度,数值性的因素 定性因素——属性因素,表征某种属性存在与否的非数值性因素 问题:能否将定性因素进行量化,以及如何引入模型中? 离散选择模型(离散被解释变量) 虚拟变量方法(离散解释变量) 3、虚拟变量的定义 计量经济学中,将取值0和1的人工变量称为虚拟变量、哑元变量,定性变量。(dummy variable) 通常用D表示 对定性变量的量化,以及对定量变量的分类,都可以采用虚拟变量的方式进行。 例如,反映文化程度的虚拟变量可取为: 本科及以上 本科以下 男性 女性 反映性别的虚拟变量可取为: 4、虚拟变量中“0”,“1”选取原则 要从分析问题的目的出发予以界定 0—代表基期,比较的基期,参照组 1—代表报告期,被比较的效应,实验组 二、虚拟变量引入方式 虚拟变量做为解释变量引入模型有两种基本方式:加法方式和乘法方式。 企业男职工的平均薪金为: 企业女职工的平均薪金为: 加法方式(1)单个虚拟变量的引入:一种因素两种状态 例:研究工龄、性别对员工工资的影响 其中:Yi为企业职工的薪金, Xi为工龄, 男性 女性 几何意义: 两个函数有相同的斜率,说明男女职工平均薪金对工龄的变化率是一样的。 如果?20,表明两个函数截距不相同,且男职工平均薪金比女职工高,两者平均薪金水平相差?2。 如果?20,表明两个函数截距不相同,且男职工平均薪金比女职工低,两者平均薪金水平相差?2。 如果?2=0,表明两个函数截距相同,即男职工,女职工的平均薪金没有显著差异。 可以通过传统的回归检验,对?2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。 ?0 ?2 例:研究收入和教育水平(分为高,中,低三类)对个人保健支出的影响。 教育水平考虑三个层次: 低学历:高中以下, 中等学历:高中,及大中专 高学历:大学及其以上。 这时需要引入两个虚拟变量: (2)多个虚拟变量的设定和引入 ——一种因素多种状态(水平): 模型可设定如下: 在E(?i)=0 的初始假定下,低学历,中等学历,高学历教育水平下个人保健支出的函数: 低学历: 中等学历: 高学历 假定?3?2,其几何意义: 问题: 虚拟变量为何只选“0”, ‘1“,选择0,1,2 等可以吗 同一种属性,两个变量能够表示几种状态? 思考,如果在模型中引入季节效应?月份效应? (3)多个虚拟变量的引入——多种因素 例:研究学历(本科及以上,本科以下),性别(男、女)对员工工资的影响。 在例1基础上,再引入代表学历的虚拟变量D2: 本科及以上学历 本科以下学历 职工薪金的回归模型可设计为: 女职工本科以下学历的平均薪金: 女职工本科以上学历
文档评论(0)