网站大量收购闲置独家精品文档,联系QQ:2885784924

虚拟变量(哑变量)回归.ppt

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

在回归分析中,因变量不仅受量化变量的影响,还受定性变量的影响(如性别,国籍,居住地,文化程度等等)量化这些定性变量的方法,是构造一个取值1或0的虚拟变量,1代表该属性出现,0代表某一属性不出现。这种编码只取0和1两个值,平均数的就代表编码为1的这类案例占样本的比例,所以可以对其进行回归。多重共线性:当自变量高度相关时,回归方程中的自变量就会相互削弱各自对因变量的边际影响,使本身的回归系数的数值下降而其标准差扩大,于是出现回归方程显著而各自变量的不显著的现象,出现多重共线性问题时,方程的回归系数是不可靠的。多重共线性:当自变量高度相关时,回归方程中的自变量就会相互削弱各自对因变量的边际影响,使本身的回归系数的数值下降而其标准差扩大,于是出现回归方程显著而各自变量的不显著的现象,出现多重共线性问题时,方程的回归系数是不可靠的。Vii、vjj分别为bi和bj的方差,vij是bi和bj之间的协方差,可以从SPSS输出的回归系数协方差系数中得到尽管虚拟变量的回归系数会有所不同,但只是因为换了参照类二每个系数的意义不同了,但所计算的各类平均值及他们之间的差不会发生变化,平均值之差的统计检验结果也不会发生变化。选择特异类作为参照类,则回归系数都显著,但其他各类之间的差别在回归方程中不能得到直接的反应;如果选择很相近的类别中的一种做参照类,特异类的回归系数显著,而另外几个回归系数就不显著了。在现实中,我们往往并不知道是否存在特异类,更不知道哪一类是特异类,这时效应编码要比虚拟编码合适一些。效应编码与虚拟编码的回归分析方程R平方和整体检验的F及其概率都是相同的——虚拟变量的应用多元线性回归Contents虚拟变量的建立1虚拟变量回归系数的意义2虚拟变量回归分析的检验3SPSS实例操作4一、虚拟变量的建立虚拟变量(DummyVariable):取值为0和1的变量,当案例属于一个虚拟变量所代表的类别时,这个虚拟变量就赋值为1,否则变赋值为0Di=1,是女性=0,不是女性例1:例2:大学生年级变量具有四个类别,如何构造?其中,D1=1,是大一,否则为0;D2=1,是大二,否则为0;D3=1,是大三,否则为0;D4=1,是大三,否则为0。“虚拟变量陷阱”虚拟变量的建立D1+D2+D3+D4=1,说明D1,D2,D3,D4存在线性相关,造成多重共线性解决办法:原则:当一个分类量具有k个类别时,则仅引入k-1个虚拟变量。当所有k-1个自变量都取0的时候,那这个案例就属于第k类,我们称这类为参照类,参照类不仅解决了共线性的问题,而且在分析回归结果时也有非常重要的意义二、虚拟变量回归系数的意义因变量为大学生的月支出,自变量有家庭月收入,年级,性别建立回归方程:(0)其中,DG2=1,是大二,否则为0;DG3=1,是大三,否则为0;DG4=1,是大三,否则为0。DS=1,是女生,否则为0虚拟变量回归系数的意义(1)参照类:大一男生(所有虚拟变量均取0)变式1:大二男生(DG2=1,虚拟变量均取0)(2)变式2:大一女生(DS=1,虚拟变量均取0)(3)参照类中,b0为直线的截距,b1为直线斜率,即INCOME的回归系数由式(1)到式(2),截距项增加了b2,因此b2就是大二男生比大一男生月支出高的部分;由式(1)到式(3),截距项增加了b4,因此b4就是大一女生比大一男生月支出高的部分。差别截距:所有表示各类别虚拟变量的回归系数(bj)表示的是该类与参照类的均值之差。(对于序次变量还可计算相邻分类的边际效应,任意两类的边际效应)虚拟变量回归系数的意义1.只考虑年级对月支出的影响等价于单因素方差分析(1-wayANOVA)2.同时考虑年级、性别对月支出的影响等价于双因素方差分析(2-wayANOVA)只考虑主效应的双因素方差分析3.同时考虑年级、性别、家庭月收入的影响等价于协方差分析(ANCOVA)含交互作用的饱和双因素方差分析三、虚拟变量回归系数的检验对整个模型的检验(F检验)H0:B1=B2=…=Bk=0H1:B1,B2,…,Bk中至少有一个不为0对各回归系数的检验(t检验)H0:Bj=0H1:Bj≠0对于虚拟变量,由于取值只能为0和1,所以检验的是取值为1的类别与参照类(所有取值为0)的平均值是否有显著性差异虚拟变量回归只能做其他类和参照类的比较

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档