- 1、本文档共345页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
客户关系管理PPT300页
决策树 决策树把数据归入可能对一个目标变量有不同效果的规则组。例如,我们希望发现可能会对直邮有反应的个人特点。这些特点可以解释为一组规则。 * 决策树 假设您是一个销售一种新的银行服务的直邮计划研究的负责人。为最大程度地获益,您希望确定基于前次促销活动的家庭细分最有可能响应相似的促销活动。通常这可以通过查找最能把响应前次促销的家庭和没有响应的家庭区分开的人口统计信息变量的组合来实现。 决策树为您提供诸如谁会最好地响应新的促销等重要线索,并通过只邮寄给最有可能响应的人来最大程度地获得直邮效益,提高整体响应率,并极有希望同时增加销售。 * 决策树建立 决策树中最上面的节点称为根节点,是整个决策树的开始。本例把响应客户作为根节点。可以看到所有收到直邮信件的人中有7%有响应。 然后根据记录字段的不同取值建立树的分支, 如分为有住房和无住房两组,则15%的租户有响应,而房主则只有5%。 还可以在每个分支子集中重复建立下层结点和分支。我们可以继续分组来发现最有可能响应的组群。这一组群可以表示为一个规则,如“如果收件人是租户,有较高的家庭收入,没有储蓄存款账户,那么他有45%的响应概率”。简单地说,有这些特点的组群中有45%可能会对直邮有响应。 * 决策树图 * 决策树应用 决策树也是分析消耗(流线性生产)、发现交叉销售机会、进行促销、信用风险或破产分析和发觉欺诈行为的得力工具。 * 决策树算法 常用的算法有CHAID、 CART、 Quest 和C5.0。 决策树的优缺点: 优点: 1)??????? 可以生成可以理解的规则。 2)??????? 计算量相对来说不是很大。 3)??????? 可以处理连续和种类字段。 4)??????? 决策树可以清晰的显示哪些字段比较重要 缺点: 1)??????? 对连续性的字段比较难预测。 2)??????? 对有时间顺序的数据,需要很多预处理的工作。 3)??????? 当类别太多时,错误可能就会增加的比较快。 4)??????? 一般的算法分类的时候,只是根据一个字段来分类。 * 聚类分析 聚类如同通常所说的“物以类聚”,是把一组个体按照相似性归成若干类别。 它的目的是使属于同一类别的个体之间的距离尽可能的小,而不同类别上的个体间的距离尽可能的大。它反映同类事物共同性质的特征型知识和不同事物之间的差异性质的特征型知识。 通过聚类,数据库中的记录可被划分为一系列有意义的子集。聚类增强了人们对客观现实的认识,是进行概念描述和偏差分析的先决条件。 * 聚类分析 簇(Cluster):一个数据对象的集合 在同一个类中,对象之间具有相似性; 不同类的对象之间是相异的。 聚类分析 把一个给定的数据对象集合分成不同的簇; 聚类是一种无监督分类法: 没有预先指定的类别; 典型的应用 作为一个独立的分析工具,用于了解数据的分布; 作为其它算法的一个数据预处理步骤; * 应用聚类分析的例子 市场销售: 帮助市场人员发现客户中的不同群体,然后用这些知识来开展一个目标明确的市场计划; 土地使用: 在一个陆地观察数据库中标识那些土地使用相似的地区; 保险: 对购买了汽车保险的客户,标识那些有较高平均赔偿成本的客户; 城市规划: 根据类型、价格、地理位置等来划分不同类型的住宅; 地震研究: 根据地质断层的特点把已观察到的地震中心分成不同的类; * 聚类分析的评判 一个好的聚类方法要能产生高质量的聚类结果——簇,这些簇要具备以下两个特点: 高的簇内相似性 低的簇间相似性 聚类结果的好坏取决于该聚类方法采用的相似性评估方法以及该方法的具体实现; 聚类方法的好坏还取决与该方法是能发现某些还是所有的隐含模式; * 人工神经网络 神经网络近来越来越受到人们的关注,因为它为解决大复杂度问题提供了一种相对来说比较有效的简单方法。神经网络可以很容易的解决具有上百个参数的问题(当然实际生物体中存在的神经网络要比我们这里所说的程序模拟的神经网络要复杂的多)。神经网络常用于两类问题:分类和回归。 * OLAP评价准则 (10)、直接数据操纵 要求数据操作直观易懂。 综合路径重定位、向上综合、向下挖掘和其他操作都可以通过直观、方便的点、拉操作完成。 (11)、柔性报表 用户通过使用OLAP服务器及其工具,可以按任何想要的方式来操作、分析、综合和查看数据,这些方式包括创建逻辑组或将行、列及单元按需要依次排放。 报表机制也应提供这种灵活性,能从各种可能的方面显示出从数据模型中综合出的数据和信息,充分反映数据分析模型的多维特性,并按用户需要的方式显示它。 (12)、维和聚集层次不受限 OLAP服务器应能在一个通用分析模型中协调至少15个维,每一个通用维应允许有任意个用户定义的聚集,而且用户分析员可以在任意给定的综合路径上建立任意多个聚集层
您可能关注的文档
- 基于STC89C52单片机的电子时钟(日历)---单片机课程设计报告附代码.doc
- 基于VHDL实现的十六路彩灯控制系统【精品文档-doc】【精品文档-doc】.doc
- 基于uC_COS的直流电机PID转速闭环调速控制系统Proteus(可编辑).doc
- 基于Web2.0的知识管理系统层次模型和平台架构研究 前沿论文.doc
- 基于Web在线辅导答疑系统的设计与实现.doc
- 基于WebGIS的杭州公交线路查询系统设计与实现论文.doc
- 基于WEB的多媒体素材管理库的开发与应用_[文档在线提供].doc
- 基于VHDL的智能函数发生器的设计毕业论文(设计)word格式.doc
- 基于WEB的网络在线考试系统-毕业论文中文摘要题目(可编辑).doc
- 基于三层分布式C_S结构模型的铁路工务地理信息系统设计和开发(可编辑).doc
- 新教材高中化学2.1.2钠的几种化合物焰色试验学案1新人教版必修第一册.doc
- 汇佳幼儿园课程设计.pdf
- 汛期防汛的应急预案.pdf
- 2025年镀锌护拦项目可行性研究报告.docx
- 新教材高中化学3.1氧化还原反应教学设计2新人教版必修第一册.doc
- 2025年真丝乔其纱项目可行性研究报告.docx
- 江苏省无锡市惠山区2023-2024学年七年级下学期期中语文试题.pdf
- 2025版新教材高中地理第2章自然地理要素及现象第4节水循环过程及地理意义讲义中图版必修1.doc
- 新教材高中化学2.2氯气的实验室制法氯离子的检验练习1含解析新人教版必修第一册.doc
- 江苏省宿迁市泗阳县2023-2024学年七年级上学期期中语文试题.pdf
最近下载
- 水电水利工程基本词汇对照表(法语).docx
- 车间班长个人年终总结范本5篇.docx
- 基于MATLAB的HDB3码编译器的优化设计与实现.pdf VIP
- 一汽奥迪AudiQ7汽车使用手册用户说明书pdf电子版下载.pdf
- 一汽奥迪Q7_车型手册电子版下载_非汽车用户车主车辆使用操作驾驶说明书.pdf VIP
- DL-T-5564-2019输变电工程接入系统设计规程.docx VIP
- 小学奥数题库《几何》-直线型-燕尾模型-2星题(含解析)全国通用版.docx
- 老年综合评估及干预技术应用规范.docx VIP
- 城市老旧小区适老化改造的路径探讨(工程毕业论文资料).doc
- 2023年中国城市居民养老政策体系与市场规模评估报告.pdf VIP
文档评论(0)