- 1、本文档共34页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
IBM SPSS Modeler 说明
数据挖掘和建模
数据挖掘是一个深入您的业务数据,以发现隐藏的模式和关系的过程。数据挖掘解决了一个常见的问题:您拥有的数据越多,就越难有效地分析并得出数据的意义,并且耗时也越长。金矿无法开采,通常是由于缺乏人力、时间或专业技术。
数据挖掘使用清晰的业务流程和强大的分析技术,快速、彻底地探索大量的数据,抽取并为您提供有用且有价值的信息,这正是您所需要的“商务智能”。
尽管您数据中的这些以前未知的模式和关系本身很有趣,但一切并不止于此。如果您可以使用这些过去行为的模式来预测未来可能发生的事情,那又会怎样?这就是建模的目标 -?模型,它包含一组从源数据中抽取的规则、公式或方程式,并允许您通过它们生成预测结果。这正是预测分析的核心。
关于预测分析
预测分析是一个业务流程,其中包含一组相关技术,通过从您的数据中总结出有关当前状况与未来事件的可靠结论,帮助制定有效的行动措施。它是以下方面的组合:
??高级分析
??决策优化
高级分析使用多种工具和技术,分析过去与现在的事件,并预测未来的结果。决策优化确定您的哪些措施可以产生最好的可能结果,并确保这些建议措施能够最有效地融入到您的业务流程中。
有关预测分析如何工作的深入信息,请访问公司网站? HYPERLINK /predictive_analytics/work.htm \t N30F4C /predictive_analytics/work.htm。
建模技术
建模技术基于对算法的使用,算法是解决特定问题的指令序列。您可以使用特定算法创建相应类型的模型。有三种主要的建模技术类别,IBM? SPSS? Modeler 为每种类别提供了一些示例:
??Classification
??关联
??细分(有时称为“聚类”)
分类模型使用一个或多个输入字段的值来预测一个或多个输出(或目标)字段的值。这些技术的部分示例为:决策树(CR 树、QUEST、CHAID 和 C5.0 算法)、回归(线性、logistic、广义线性和 Cox 回归算法)、神经网络、Support Vector Machine (SVM) 和贝叶斯网络。
关联模型查找您数据中的模式,其中一个或多个实体(如事件、购买或属性)与一个或多个其他实体相关联。这些模型构建定义这些关系的规则集。数据中的字段可以作为输入和目标。您可以手动查找这些关联,但关联规则算法可以更快速地完成,并能探索更多复杂的模式。Apriori 和 Carma 模型是使用此类算法的示例。另一种类型的关联模型是序列检测模型,后者可以在按时间建立结构的数据中查找顺序模式。
细分模型将数据划分为具有类似输入字段模式的记录段或聚类。细分模型只对输入字段感兴趣,没有输出或目标字段的概念。细分模型的示例为 Kohonen 网络、K-Means 聚类、两步聚类和异常检测等。
我如何知道使用哪种技术?
有这样种类繁多的技术摆在面前,很难知道从哪里开始解决您的特定问题。幸运的是,IBM? SPSS? Modeler 可以通过自动化建模形式替您做出其中的部分决定。这是一种功能强大的技术,它能评估和比较多种不同建模方法,并按有效性顺序对它们进行排序。这样,您可以在单次建模运行中尝试多种方法。
自动建模
使用说明
要启动该应用程序,请从 Windows“开始”菜单的 SPSS Inc 程序组中选择IBM? SPSS? Modeler?14.1。几秒钟后,屏幕上将显示主窗口。
在数据挖掘过程中的每一个阶段,均可通过 IBM? SPSS? Modeler 易于使用的界面来邀请特定业务的专家。建模算法(如预测、分类、细分和关联检测)可确保得到强大而准确的模型。模型结果可以方便地部署和读入到数据库、IBM? SPSS? Statistics 和各种其他应用程序中。
使用 SPSS Modeler 即处理数据的三个步骤。
??首先,将数据读入 SPSS Modeler,
??然后,然后通过一系列操纵运行数据,
??最后,将数据发送到目标位置。
这一操作序列称为数据流,因为数据以一条条记录的形式,从数据源开始,依次经过各种操纵,最终到达目标(模型或某种数据输出)
流工作区是 IBM? SPSS? Modeler 窗口的最大区域,也是您构建和操纵数据流的位置。
通过在界面的主工作区中绘制与业务相关的数据操作图表来创建流。每个操作都用一个图标或节点表示,这些节点通过流链接在一起,流表示数据在各个操作之间的流动。
在 SPSS Modeler 中,可以在同一流工作区或通过打开新的流工作区来一次处理多个流。会话期间,流存储在 SPSS Modeler 窗口右上角的“流”管理器中。
IBM? SPSS? Modeler 中的大部分数据和建模工具位于节点选项板中,该选项板位
文档评论(0)