- 1、本文档共67页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
根据上面 3 个回归方程可以求得: 二、应用举例 【例8.6】对某地人群调查其对所从事的工作是否满意,可能的影响因素:年龄、性别、年收入水平、文化程度。 ①初中及以下②高中③大专④大学⑤研究生 Edu(文化程度) ①2.5万以下②2.5~③5.0~④7.5万及以上 Inccat(年收入水平) F女性、m男性 Gender(性别) 岁 Age(年龄) ①不满意②态度中立③满意④⑤ Satis(满意度) 赋值 变量名 ⑴单击“分析→回归→有序,出现下列对话框: ⑵将 satis 选入“因变量”列表框; ⑶将 inccat、edu、gender 选入“因子”列表框,age 选入“协变量”列表框; ⑷单击“确定”,输出结果。 上图为对模型中是否所有自变量的偏回归系数全为0进行似然比检验,结果说明至少有一个自变量的偏回归系数不为0。 上图是Pearson和Deviance两种拟合优度检验结果。但这两个统计量有个致命的缺点:对于自变量取值水平组合的实际观察频数为0的比例十分敏感,如果上述比例过高,这两个统计量不一定仍服从卡方分布,因而基于卡方分布计算的Sig值也不可信,其结果不一定能真实反映模型的拟合效果。 根据以上结果,建立如下模型: 根据以上结果,建立如下模型: * * * 可以看到,x1 (年龄)、x3 (性别)两个自变量都是显著的,因而最终的回归方程为: 根据以上方程式可知: ⑴年龄越高乘车的比例也越高; ⑵女性乘公共汽车的比例高于男性。 【例8.3】研究银行客户的贷款拖欠问题。通过分析银行掌握的一些客户资料和交易信息,推断指定客户的预期信誉。数据格式如下: 本例数据集中的前700个案例是先前申请过贷款的用户,将利用其中的一个随机样本拟合一个二元逻辑回归模型,然后用拟合的模型对后150名预期用户进行信誉分类。 因变量为是否拖欠(default),取值为0(No)时,表示没有拖欠贷款;取值为1(Yes)时,表示有拖欠贷款。 ⑴抽取分析样本 ①指定随机种子。依次单击“转换→随机数字生成器……” 命令,打开生成随机数的设置界面。输9191972 ②计算筛选变量。依次单击“转换→计算变量……”命令。在“目标变量”处输入变量名“validate”;在“数字表达式” 编辑框输入 rv.bernoulli(0.7)。单击左下角的“如果”并输入 Missing(default)=0 ⑵变量设置 将是否拖欠变量(default)作为因变量选入“因变量”框,将从年龄至其他债务8个变量作为协变量选入“协变量”列表框。选中“向前:LR”,单击 “validate” 进入“选择变量”框,单击“规则”,选中“等于”选项,输入1。 ⑶分类变量设置 在变量列表中选中教育水平变量,将其作为分类变量。 ⑷保存设置 勾选:“概率”、“学生化”、“Cook距离”和“包含协方差矩阵”复选框。 ⑸选项设置 勾选:“分类图”和“Hosmer-Lemeshow拟合度”复选框。 单击“确定”,系统输出以下结果: 上表中 Cox and Snell R 方和 Nagelkerke R 方两个统计量取代了线性回归中的 R 方统计量。 本例中他们的取值分别为 0.281 和 0.417,只看这一点,模型拟合的并不理想。 这两个统计量一般用于不同模型之间的比较,R 方值越大的模型,拟合的效果越好。 Hosmer 和 Lemeshow 检验表格的原假设为:模型能够很好拟合数据。 从软件运行结果看:显著性检验的Sig=0.855 结论:接受原假设,认为模型能够很好拟合数据。 Hosmer 和 Lemeshow 检验的随机性表格根据目标变量的预测概率,把结果分为大致相等的10个组。 “总计”列中是每组的观测数,由于预测值相等的观测被分到一起,所以各组的观测数不一定相同。 此表直观地反映了模型预测的效果,可以看出各组的观测值和预测值大致相同,所以模型的拟合效果不错。 上表给出了观测值和预测值的列联表,预测概率大于0.5,预测为Yes;反之预测为No。 对于最终模型,建模用的124个拖欠用户中有57个判断正确,正确率为46.0%;建模用的375个无拖欠用户中有352个判断正确,正确率为93.9%;总的回判正确率为82.0%,这说明模型的预测效果不错,尤其是对那些无拖欠的用户的预测。 上表中Wald统计量的Sig值全部小于0.05,说明参数估计值都显著地不为0。利用该模型,就可以对150名预期用户进行信誉分类。 Exp(B)表示在其它情况不变的
您可能关注的文档
- 第7节体积单位间的进率.ppt
- 第7章陀螺仪的应用.ppt
- 第7章药物对神经系统的毒性.ppt
- 第7组注射用鲑鱼降钙素.ppt
- 第7讲--形函数、刚度矩阵.ppt
- 第7章运输管理.ppt
- 第7节女性生理卫生.ppt
- 第7苏联的改革与解体.ppt
- 第7讲质量与密度.ppt
- 第7讲物质运输的实例.ppt
- DB12∕T 630.1-2021 天津质量奖 第1部分:评价总则.docx
- DB23_T 3869-2024 实验动物 教学用实验动物管理规范.docx
- DB11T 1053.6-2013 实验用鱼 第6部分:环境条件.docx
- DB12T 703-2016 商贸物流仓储管理规范.docx
- DB12T 533-2014 公共服务单位服务标准体系标准编号规则.docx
- DB34_T 4962-2024 造血干细胞移植全流程管理规范.docx
- DB23_T 3845-2024 黑龙江省地震预警信息发布规范.docx
- DB12_T 1104-2021 甜樱桃苗木种植等级技术规范.docx
- DB11∕T 1326-2016 中小学校晨午检规范.docx
- DB12T 714-2016 笼车 一般要求.docx
文档评论(0)