- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
虚拟变量的转换与回归分析概要
回归分析的类型 因变量与自变量都是定量变量的回归分析——即我们常做的回归分析 因变量是定量变量,自变量中有定性变量的回归分析—即含有虚拟变量的回归分析 因变量是定性变量的回归分析—Logistic回归分析 自变量中有定性变量的回归 在社会经济研究中,由许多定性变量,比如地区、民族、性别、文化程度、职业和居住地等。 可以应用它们的信息进行线性回归。 但是,必须现将定性变量转换为哑变量(也称虚拟变量),然后再将它们引入方程,所得的回归结果才有明确的解释意义。 哑变量的建立 对于具有k类的定性变量来说,设哑变量时,我们只设k-1个哑变量。 例7.4 分析某地区妇女的年龄、文化程度、及居住地状况对其曾生子女数的影响。 定量变量: 年龄 定性变量:文化程度、地区 哑变量的建立 原变量编码值 哑变量赋值的操作 文化程度=1(文盲) 所有EDU=0 文化程度=2(小学) EDU2=1,其他EDU=0 文化程度=3(初中) EDU3=1,其他EDU=0 文化程度=4(高中) EDU4=1,其他EDU=0 文化程度=5(大学) EDU5=1,其他EDU=0 地区=1(城市) AREA=1 地区=2(农村) AREA=0 应用SPSS建立回归方程 回归结果: SPSS输出结果 SPSS输出结果 回归方程的解释 当案例在两个分类变量都等于0时,即文化程度为文盲,居住地在农村时,此种情况称为参照类(其他情况将于此进行比较),其回归方程为: 表明所有参照类妇女年龄每上升1岁,其曾生子女数的平均变化量为0.068个。 回归方程的解释 当文化程度为小学,居住地为农村时: 表明,对于相同年龄和居住地而言,小学文化程度妇女比文盲妇女曾生子女数多出b2个部分,即少生1.13个子女。 回归方程的解释 当教育程度为文盲、居住地为城市时, 表明,对于相同年龄和文化程度而言,城市妇女比农村妇女曾生子女数多出b6个部分,即少生0.49个子女。 回归方程的解释 总之,该回归方程表示: 参照类妇女曾生子女数对年龄的回归直线的截据为1.41,年龄每上升1岁,参照类妇女的平均曾生子女数上升0.068个。 城市妇女比农村妇女的平均曾生子女数少0.49个。 小学、初中、高中和大学文化程度妇女的平均曾生子女数分别比文盲妇女少1.13、1.31、1.58、1.57个(在年龄和居住地相同时)。 回归方程的解释 文化程度在实际中是一个序次变量。可以用 表示序次变量个相邻分类的实际效应,如初中的边际效应为: 类似,可以计算下面的边际效应: 小学= -1.13 初中= -0.18 高中= -0.27 大学= 0.01
文档评论(0)