第八章虚拟变量的建模.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章虚拟变量的建模

第八章 虚拟变量的建模 背景 定类与定序变量统称为定性变量 在经济领域,许多重要因素都需要使用定性数据加以刻画: 经济体制(改革前-改革后)、所有制形式(国有-集体-外资等等)、区域(东-中-西)、性别(男-女)、信用等级 自变量采用定性数据,在量化与解释上要十分注意,因变量如果采用定性数据,会给模型的估计与解释带来更大的困难。 背景 本章的研究对象是定性变量 无论是定类还是定序,处理方法是一致的 但,当定序变量的水平很多时,可以当定量变量处理 例:大学排名 背景 定性变量的水平可以是自然的,也可以是人为规定的 自然的:性别 人为规定: 规定水平:相貌对工资的影响 合并水平(计量等级的退化): 地区差异对人均收入的影响 大学排名对最初工资的影响 背景 有时,自变量的影响有如下模式:在某个区间内的变动,不会显著影响因变量,但区间外与区间内的不同则会有显著影响。此时直接用原始变量效果不好,则可将变量转换为水平较少的定性变量进行建模 定量变量的系数不显著,有时将其退化为定性变量就会显著。 背景 定性变量有些来自于不得已 有些来自于主动 主要内容 一、定性变量作为自变量的建模方法 虚拟变量法 二、定性变量作为因变量的建模方法 一、定性变量作为自变量的建模 (一)二值变量的建模 1、二值变量的量化方法 2、回归系数的含义 3、多个虚拟变量的建模与解释 4、含虚拟变量模型的其他变化 5、Chow检验 (二)多值变量的建模 (一)二值变量的建模 所谓二值变量,是指变量只有两种可能取值,是某种属性或者不是 二值变量可以是自然的,也可以是人为规定的 人为规定:所有制:国有企业-非国有企业 1、二值变量的量化方法 可以有三种量化方法 1) 1、二值变量的量化方法 2) 1、二值变量的量化方法 3) 1、二值变量的量化方法 使用虚拟变量(dummy variable)的基本原则 0,1只是代号 用0,1代入,会有较好的经济含义 二值变量,只需设置一个虚拟变量,否则会出现完全共线性问题(有截距项) 2、回归系数的含义 较正式的表述: 2、回归系数的含义 虚拟变量回归系数的基本含义: 不同属性模型之间的截距移动 2、回归系数的含义 虚拟变量回归系数可以解释为:在其他因素水平相同的情况下,不同属性的平均差异 以前数据为例,虚拟变量回归系数为67, 意味着在资本水平相同的情况下,三资企业的平均利润要高于国有及国有控股企业67亿元。 在解释时,一定要注意谁是基组(取0) 2、回归系数的含义 类似模型都蕴含有一个假定: 斜率是一致的,即无论对于哪一组(按虚拟变量属性划分),其它变量对因变量的影响都是一样的 4、含虚拟变量模型的其他变化 考虑交互影响的模型 显然,资本水平不同,利润会有不同,三资企业和国有企业的差异也不会都是67亿元。 4、含虚拟变量模型的其他变化 在交互模型中,虚拟变量前的回归系数只表示在资本为0情况下,三资企业与国有企业的利润差距 4、含虚拟变量模型的其他变化 交互模型中虚拟变量前回归系数的经济含义不好,可以采用如下方法解决: 4、含虚拟变量模型的其他变化 4、含虚拟变量模型的其他变化 交互项的引入实际意味着非虚拟变量的斜率是不一致的。 4、含虚拟变量模型的其他变化 判断是否需要交互项,可通过相应系数的t检验来进行; 要注意到:是否需要交互项等价于检验斜率是否相等; (二)多值变量的建模 多值变量意味着虚拟变量有3个以上取值, 如考虑季节的影响,则季节有四个水平。 (二)多值变量的建模 正确量化方法 (二)多值变量的建模 基本原则: 只用0,1来量化,0,1只表示真或不真 只需设置比水平数少一个的虚拟变量 (二)多值变量的建模 基本解释 每个虚拟变量前的系数都表示和基组(不专设虚拟变量的组)相比,在因变量上的平均差异。 (二)多值变量的建模 对于定序变量而言,由于水平之间的差值依然没有意义,所以,上述方法仍然适用。 (二)多值变量的建模 有时,某定性因素的多个虚拟变量在统计上都不显著,但这并不意味着该因素就一定是不显著的,此时联合检验将发挥关键作用。 要点 自变量中定性变量的回归系数,在解释上与定量变量有很大不同,此时判定系数含义,主要不使用导数,而是依靠将定性变量代入,计算不同方程之间的差别。

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档