(计量经济学第7章含有定性信息的多元回归分析.doc

(计量经济学第7章含有定性信息的多元回归分析.doc

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(计量经济学第7章含有定性信息的多元回归分析

含有定性信息的多元回归分析: 二值(或虚拟)变量 在前面几章中,我们的多元回归模型中的因变量和自变量都具有定量的含义。就像小时工资率、受教育年数、大学平均成绩、空气污染量、企业销售水平和被拘捕次数等。在每种情况下,变量的大小都传递了有用的信息。在经验研究中,我们还必须在回归模型中考虑定性因素。一个人的性别或种族、一个企业所属的产业(制造业、零售业等)和一个城市在美国所处的地理位置(南、北、西等)都可以被认为是定性因素。 本章的绝大部分内容都在探讨定性自变量。我们在第7.1节介绍了描述定性信息之后,又在第7.2、7.3和7.4节中说明了,如何在多元回归模型中很容易地包含定性的解释变量。这几节几乎涵盖了定性自变量用于横截面数据回归分析的所有流行方法。 我们在第7.5节讨论了定性因变量的一种特殊情况,即二值因变量。这种情形下的多元回归模型具有一个有趣的含义,并被称为线性概率模型。尽管有些计量经济学家对线性概率模型多有中伤,但其简洁性还是使之在许多经验研究中有用武之地。虽然我们在第7.5节将指出其缺陷,但在经验研究中,这些缺陷常常都是次要的。 7.1 对定性信息的描述 定性信息通常以二值信息的形式出现:一个人是男还是女;一个人有还是没有一台个人计算机;一家企业向其一类特定的雇员提供还是不提供退休金方案;一个州实行或不实行死刑。在所有这些例子中,有关信息可通过定义一个二值变量(binary variable)或一个0-1变量来刻画。在计量经济学中,对二值变量最常见的称呼是虚拟变量(dummy variable),尽管这个名称并不是特别形象。 在定义一个虚拟变量时,我们必须决定赋予哪个事件的值为1和哪个事件的值为0。比如,在一项对个人工资决定的研究中,我们可能定义female为一个虚拟变量,并对女性取值1,而对男性取值0。这种情形中的变量名称就是取值1的事件。通过定义male在一个人为男性时取值1并在一个人为女性时取值0,也能刻画同样的信息。这两种情况都比使用gender更好,因为这个名称没有指出虚拟变量何时取值1:gender=1对应于男性还是女性?虽然怎样称呼变量对得到回归结果而言并不重要,但它总有助于选择那些使方程和阐述都更清晰的变量。 表7.1 WAGE1.RAW中的局部数据列表 个人编号 wage educ exper female married 1 3.10 11 2 1 0 2 3.24 12 22 1 1 3 3.00 11 2 0 0 4 6.00 8 44 0 1 5 5.30 12 7 0 1 525 11.56 16 5 0 1 526 3.50 14 5 1 0 假设我们在工资的例子中已选择了female来表示性别。此外,我们还定义了一个二值变量married,并在一个人已婚时取值1,而在其他情况下取值0。表7.1给出了可能得到的一个数据集的部分列表。我们看到,第1个人为女性并且未婚,第2个人为女性并且已婚,第3个人为男性并且未婚,等等。 我们为什么要用数值0和1来描述定性信息呢?在某种意义上,这些值是任意的:用任意两个不同的数值都是一样的。使用0-1变量来刻画定性信息的真正好处,像我们将看到的那样,在于它导致回归模型中的参数有十分自然的解释。 7.2 只有一个虚拟自变量 我们如何在回归模型中引入二值信息呢?在只有一个虚拟解释变量的最简单情形中,我们只在方程中增加一个虚拟变量作为自变量。比如,考虑如下决定小时工资的简单模型: (7.1) 我们用表示female的参数,以强调虚拟变量参数的含义;以后,无论如何,我们还是使用最方便的符号。 在模型(7.1)中,只有两个被观测因素影响工资:性别和受教育水平。由于对女性female=1,而对男性female=0,所以参数具有如下含义:给定同等受教育程度(和同样的误差项u),是女性与男性之间在小时工资上的差异。因此,系数决定了是否对女人存在歧视:如果0,那么在其他因素的相同水平下,女人总体上挣得要比男人少。 用期望的术语来讲,如果我们假定了零条件均值假定E(u?female, educ)=0,那么 = E(wage?female=1, educ)? E(wage?female=0, educ). 由于female=1对应于女性和female=0对应于男性,所以我们可以更简单地把这个模型写成 = E(wage?female, educ)? E(wage?male, educ).

文档评论(0)

shit0605 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档