毕业论文设计开题报告.doc

下载文档 降价啦

56
0
约8.51千字
约 10页
2017-09-26 发布于广西
举报
版权申诉
保障服务

毕业论文设计开题报告.doc

1、本文档共10页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

分类号学生学号 200710520120 密级编号景德镇陶瓷学院学士学位论文开题报告申请人姓名：王中华申请学科专业：信息与计算科学研究方向：数据挖掘在陶瓷企业CRM系统中的研究应用导师姓名：赵丽萍年级： 2007级景德镇陶瓷学院本科生毕业论文（设计）开题报告姓名王中华年级 2007级导师姓名赵丽萍毕业论文（设计）题目数据挖掘在陶瓷企业客户关系管理系统中的应用研究一、选题依据 1、国内外研究现状（1）数据挖掘的研究现状和发展态势数据挖掘是指从存放在数据库、数据仓库或其他信息库中的大量数据中挖掘人们感兴趣知识的过程。其中知识表示为概念、规则、规律、模式等形式，它们是隐含的、事先未知的潜在有用信息，在在陶瓷企业的数据深处蕴藏着未被发现的机会，可以用数据挖掘技术来发现。数据挖掘技术可以应用到陶瓷企业客户关系管理的许多领域，主要有客户获取、交叉销售、客户细分、客户盈利能力分析和客户流失分析等。在CRM系统中，可以通过数据挖掘技术来进行客户细分，把大量的客户分成不同的类，每个类里的客户有相似的属性，而不同的类里的属性则不同。企业只需对属于同一类中的客户采取相同的个性化服务，即可大大降低企业的成本。粗糙集算法粗糙集理论[Rough Set theory]是由波兰数学家 Z.Pawlak提出的，为处理数据〔特别是带噪声、不精确或不完全数据〕分类问题提供了一套严密的数学工具，使得对知识能够进行严密的分析和操作。又由于数据挖掘的深入研究和一些成功的商业运作，使得粗糙集理论和数据挖掘有了天然的联系，粗糙集在知识上的定义、属性约简、规则提取等理论，使得数据库上的数据挖掘有了深刻理论基础，从而为数据挖掘提供了一种崭新的工具。粗糙集不仅自己可以独特的挖掘知识，而且可以和其他的数据挖掘算法结合起来，从而产生了学多混合数据挖掘算法，大大开拓了数据挖掘的算法和技术，丰富了数据挖掘的工具。除了研究，人们也在积极寻找粗糙集在数据挖掘中的应用，如RSES系统，该系统是基于粗糙集理论上研制的数据挖掘系统，里面提供了粗糙集的属性约简算法和规则提取，可以找到最佳约简集和近似约简集，并可以提出规则。另外，还有，Regina大学开发的KDD-R系统，被广泛用于医疗诊断、电信业等领域。还有美国Kansas大学开发的LERS(Learning from Examples based on RS)系统，在医疗诊断、社区规划、全球气象研究等方面都有应用。90％还买牛奶，这就是一条关联规则。在商场中将这两样物品摆放在一起销售，将会提高销售量。在大型数据库中，这种关联规则是很多的，需要进行筛选，一般用“支持度和“置信度”两个阙值来淘汰那些无用的关联规则。“支持度”表示该规则所代表的事例(元组)占全部事例(元组)的百分比。“置信度表示该规则所代表事例占满足前提条件事例的百分比例。在数据挖掘研究领域，最著名、最重要的关联规则发现算法是R．Agrawal等人提出的Apriori算法。随着对于关联分析的研究深入，人们提出了多种关联规则的挖掘算法，使得关联规则发现的研究趋势从单一概念层次关联规则发现发展到多概念层次的关联规则发现。另外，关联规则知识的进一步处理、模糊关联规则的发现、高效率的关联规则挖掘算法、网络数据中关联规则发现也是未来关联规则挖掘要深入研究和解决的问题。决策树算法决策树也称为判定树，它是用于分类和预测的主要方法之一。决策树技术发现数据模式和规则的核心是归纳算法。它的目的是根据某个新记录的属性，将其分派到预先定义好的若干类中的一个，并为其添加一个字段以标识该记录的类别。构建决策树的算法很多，其中最具代表性的是ID3和C4．5算法。它们的算法思想大致如下：将给定训练集作为决策树的根结点，训练集中的记录具有标识类别的字段，利用信息增益来寻找结点上具有最大信息量的字段，根据对该字段的不同取值建立该结点的若干分支，并为所有分支子集建立对应的结点。在每个分支子集中重复立下层分支和结点，直到结点中所有记录的类别都相同为止，这样便生成了一棵完整的决策树。因为完整的决策树不利于分类和预测，因此还要对该决策树进行剪枝处理，产生最终的决策树。然后把决策树的结点