第9章 含定性变量的回归模型.pptVIP

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
对每个样品计算出因变量y取第j个类别的 概率,因变量的预测值就是 最大的类别。 可以用Save按钮保存预测概率和预测值,表9.6是前20个样品的预测数值。 §9.6 因变量是顺序变量的回归 当定性因变量y取k个顺序类别时,记为1,2,…,k,这里的数字1,2,…,k仅表示顺序的大小。 因变量y取值于每个类别的概率仍与一组自变量x1,x2,…,xp有关,对于样本数据 (xi1,xi2,…,xip ;yi),i=1,2,…,n ,顺序类别回归模型有两种主要类型, 一种是位置结构(Location component)模型, 另一种是规模结构(Scale component)模型。 位置结构模型: (9.36) 规模结构模型: 其中是x1,x2,…,xp的一个子集,作为规模结构解释变量, (9.37) 还是使用SPSS软件自带的一个数据文件german_credit.sav说明此方法。 【例9.8】 一个信贷员想评估信贷业务的风险,选取客户的帐户状态(account status)作为因变量,有5个有序类别值,分别是 1——无债务历史, 2——目前无债务, 3——目前有正在偿还的债务, 4——曾拖欠债款, 5——危机的帐户。 解释变量由多个财务和个人资料变量构成。 进入有序数据回归对话框。 把因变量account status[chist]选入Dependent框条中。 把定性自变量# of existing credits [numcred], Other installment debts [othnstal]和Housing [housng] 选入 factors框条中。 把数值型自变量 Age in Years [age]和Duration in months [duration] 选入covariates框条中。 点击Options按钮选择Complementary Log-Log类型的联系函数,这是因为通过对因变量的频数分析发现类别3和5出现的频率很大,属于高层类别出现几率大的分布。 应用回归分析 The end 3.回归方程的限制 当因变量为0、1虚拟变量时,回归方程代表概率分布,所以因变量均值受到如下限制: θ≤E(yi)=πi≤1 对一般的回归方程本身并不具有这种限制,线性回归方程yi=β0+β1xi将会超出这个限制范围。 §9.4 Logistic回归模型 一、分组数据的Logistic回归模型 针对0-1型因变量产生的问题,我们对回归模型应该做两个方面的改进。 第一,回归函数应该改用限制在[0,1]区间内的连续曲线,而不能再沿用直线回归方程。 限制在[0,1]区间内的连续曲线有很多,例如所有连续型随机变量的分布函数都符合要求,我们常用的是Logistic函数与正态分布函数。Logistic函数的形式为 Logistic函数的中文名称是逻辑斯谛函数,或简称逻辑函数。 第二,因变量yi本身只取0、1两个离散值,不适于直接作为回归模型中的因变量。 由于回归函数E(yi)=πi=β0+β1xi表示在自变量为xi的条件下yi的平均值,而yi是0-1型随机变量,因而E(yi)=πi就是在自变量为xi的条件下yi等于1的比例。这提示我们可以用yi等于1的比例代替yi本身作为因变量。 下面通过一个例子来说明Logistic回归模型的应用。 例9.4 在一次住房展销会上,与房地产商签定初步购房意向书的共有n=325名顾客中,在随后的3个月的时间内,只有一部分顾客确实购买了房屋。购买了房屋的顾客记为1,没有购买房屋的顾客记为0。以顾客的年家庭收入(万元)为自变量x,对如下的数据,建立Logistic回归模型 Logistic回归方程为 其中c为分组数据的组数,本例c=9。做线性化变换,令 上式的变换称为逻辑(Logit)变换,得 pi′=β0+β1xi+εi (9.16) (9.18) (9.17) 计算出经验回归方程为 -0.886+0.156x (9.19) 判定系数r2=0.9243,显著性检验P值≈0,高度显著。还原为(9.16)式的Logistic回归方程为 利用(9.20)式可以对购房比例做预测,例如对x0=8, 我们用Logistic回归模型成功地拟合了因变量为定性变量的回归模型,但是仍然存在一个不足之处,就是异方差性并没有解决,(9.18)式的回归模型不是等方差的,应该对(9.18)式

文档评论(0)

smashing + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档