- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第九讲定类或定序因变量回归分析线性回归模型在定量分析中广为流行,然而当因变量是一个定类变量而不是一个连续变量时,很难应用线性回归模型。又如在研究态度与偏好等心理现象时也经常按几个类型进行测量的,如“强烈反对”、“反对”、“中立”、“支持”、和“强烈支持”。如政治学中研究是否选举某候选人,经济学研究中涉及的是否销售或购买某种商品,如在社会学和人口学研究中所涉及的如犯罪、逃学、迁移、结婚、离婚、生育、患病等等都可以按照二分类变量或多分类来测量。另外,有时对一些连续变量也要转换成类型变量,如在分析升学考试的影响因素时,将考生分为录取线以上和录取线以下,只要选定一个分界点,连续变量便可以被转换成定类变量。一、问题的提出从统计理论上看,在进行最小二乘法的参数估计时,我们仅仅关注残差项ε的分布,很少对因变量Y所服从的分布予以关注,实际上,我们拥有Y的信息要远远大于拥有残差项ε的信息。二项分布(binomialdistribution)因变量Y服从正态分布的推断来源于残差项服从正态分布,因为Y是残差项的线性函数。事实上,社会经济现象往往有不同于正态分布的其他分布,例如:泊松分布(Poisson)二、线性概率模型1、模型建立以最小二乘法为基础的线性回归方程是估测因变量的平均值,而二分变量的均值有一个特定的意义,即概率。用普通线性回归方程估测概率,就是所谓的线性概率回归。用公式表示为:P=a+∑βiXi+ε对二项分布线性概率模型的结果解释:在其他变量不变的情形下,x每增加一个单位,事件发生概率的期望将变动β个单位。例如,林楠和谢文(1988)曾用线性概率模型估测入党(政治资本)的概率,模型为:P=-0.39+0.01A+0.04E+0.03U其中:P—党员概率,A—年龄,E—受教育年限,U—单位身份2、线性概率模型存在的问题1)异方差性普通最小二乘法假设残差项的方差是相同的,但二项分布的方差为p(1-p),这意味着方差是中间大,两边小,所以方程中残差项的方差不可能恒定。2)非正态性在给定自变量x条件下,?是y的预测值与实际值的离差。由于y仅仅有0和1两个值,误差项?要么等于,或者很明显,该误差项不是正态分布。3)无意义的解释从解释力上看,由于概率的值是有边界的,在0与1之间。但林楠方程很有可能要超过该限制,因变量的估计值可能是负数,也可能大于1,因此模型的结果是无意义的。例如,运用林楠方程,我们发现如果年龄为100岁,受教育程度超过10年,则入党的概率约等于1。4)非线性关系01既然用线性概率回归存在以上两个方面的局限性,我们能否用比率做因变量呢?02比如用男女比率作因变量,用成功与不成功之比做因变量。用比率做因变量可以建立估计方程,但存在的问题是,比率是非对称的.03一个简单的解决办法就是取对数,结果就是所谓对数比率(logit)。若用P代表某事件的概率,则对数比率函数的定义为04g(P)=log(P/1-P)05以对数比率为因变量对自变量X1,X2,X3……做回归称为对数比率回归(logisticregression),其方程式为:模型建立三、简单对数比率回归表1概率、比率和对数比率概率0.010.100.200.300.400.500.600.700.800.900.99比率0.010.110.250.430.671.001.502.334.009.0099对数比率-4.60-2.20-1.39-0.85-0.410.000.410.851.392.204.60该模型即为logit回归模型。logit回归模型实际上是普通多元线性回归模型的推广,但它的误差项服从二项分布而非正态分布,因此,需要采用极大似然估计方法进行参数估计,参数?称为logit回归系数,表示当其他自变量取值保持不变时,该自变量取值增加一个单位引起的发生比自然对数值的变化量。发生比是事件的发生频数与不发生频数之间的比,即:Odds=(事件发生频数)/(事件不发生频数)当比值大于1时,表明事件更有可能发生。比如一个事件发生的概率为0.6,事件不发生的概率为0.4,发生比等于0.6/0.4=1.5。事件发生的可能性是不发生的1.5倍。2、发生比极大似然估计的基本思想概率问题例1、假定我们
文档评论(0)