spss课件26分解.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
6.“导出” 单击“导出”按钮,如图26-24所示。 7.“选项” 单击“选项”按钮,如图26-25所示。 用户缺失值:要在分析中包含个案,因子必须具有有效值。通过这些控制可以决定是否将用户缺失值在因子变量和分类因变量中视为有效值。 实例详解 1.使用径向基函数分类电信客户 电信提供商按照服务用途模式划分客户群,将客户分类成四组。如果人口统计学数据可用于预测组成员资格,则可以为各个潜在客户定制服务。 假设当前客户的信息包含在 telco.sav 中。使用径向基函数过程分类客户。 2.准备数据以进行分析 设置随机数种子,请从菜单中选择: 单击“转换”|“随机数字生成器...”命令,弹出随机数字生成器对话框,如图26-26所示。选择“设置起点”。选择“固定值”并键入9191972 作为值,单击“确定”按钮。 3.主要结果解读 (1)个案处理摘要 个案处理摘要显示,有665个个案被分配到培训样本、224个被分配到测试样本以及111个被分配到了保持样本。没有个案从分析中排除。 (3)模型摘要 (4)Classification (5)观察预测图 (6)ROC 曲线 曲线范围,如图26-37所示。 (7)累积增益和增益图 THE END IBM-SPSS 第26章 神经网络模型 神经网络是一种灵活的自适应学习系统,可以根据观测数据自动地发现数据中的模式,并开发非线性系统模型,从而进行可靠的预测,它为解决许多现实世界的问题提供了一种很有前途的方法。 神经网络是一个非线性的数据建模工具集合,它包括输入层和输出层、一个或者多个隐藏层。神经元之间的连接赋予相关的权重,训练算法在迭代过程中不断调整这些权重,从而使得预测误差最小化并给出预测精度。 实例详解 使用多层感知器评估信用风险,银行信贷员需要能够找到预示有可能拖欠贷款的人的特征,然后使用这些特征来识别信用风险的高低。假设 850 名以往客户和潜在客户的信息包含在 bankloan.sav中。前 700个个案是以前曾获得贷款的客户。请使用这 700 名客户的随机样本创建多层感知器,而留出其余客户用于验证分析。然后使用该模型将 150 名潜在客户按高或低信用风险分类。 模块解读 1.创建多层感知器网络 从菜单中选择:单击“分析”|“神经网络”|“多层感知器...”命令,弹出多层感知器对话框,如图26-2所示。 (1)“变量” 选择至少一个因变量。 至少选择一个因子或协变量。 根据需要,在变量选项卡上您可以更改重标度协变量的方法,参照上述“归一化”。 (2)“分区”:单击“分区”选项卡,如图26-3所示。 (3)“体系结构”:单击“体系结构”选项卡,如图26-4所示。 (4)“培训”单击“培训”选项卡,如图26-5所示。 (5)“输出”:单击“输出”选项卡,如图26-6所示。 (6)“保存”单击“保存”选项卡,如图26-7所示。 (1)导出:单击“导出”选项卡,如图26-8所示。 导出选项卡用于将每个因变量的键结值估算保存到XML(PMML)文件中。可以使用该模型文件以应用模型信息到其他数据文件用于评分目的。如果已经指定拆分文件,此选项不可用。 (2)选项:单击“选项”选项卡,如图26-9所示。 操作步骤 1.准备数据以进行分析 设置随机数种子,请从菜单中选择: 单击“转换”|“随机数字生成器...”命令,弹出随机数字生成器对话框,如图26-10所示。选择“设置起点”。选择“固定值”并键入9191972 作为值(用户也可以自行设定其他值)。单击“确定”按钮。大约 70% 以往客户被分配至训练样本,30% 被分配至坚持样本。将需要分区变量精确地重新创建用于那些分析的样本。 要创建分区变量,请从菜单中选择:单击“转换”|“计算变量...”命令,弹出计算变量对话框,如图26-11所示。 2.运行分析 要运行“多层感知器”分析,请从菜单中选择: 单击“分析”|“神经网络”|“多层感知器...”命令,弹出多层感知器对话框,如图26-12所示。 单击“分区”选项卡,如图26-13所示。 单击“输出”选项卡,如图26-14所示。 3.个案处理摘要 4.网络信息 5.模型摘要 6.Classification 7.结论 在用于创建模型的个案中,以前拖欠贷款的124人中有74人分类正确。375名未欠贷者中有347人分类正确。整体上,84.4%训练个案分类正确,与模型摘要表中15.6%显示不正确项相对应。更好的模型应正确识别出更高百分比的个案。 基于创建模型所用个案的分类从其分类率有所夸大的意义上来说,倾向于过度“乐观”。保持样本帮助验证模型;这些个案中,有74.6% 是由模型正确分类的。这意味着,总体来说,您的模型实际上有七五成是正确的

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档