- 1、本文档共37页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
商务智能伍章俊智能商务研究所wuzhangjun@
2024/11/26?TheInstituteofBusinessIntelligence,HFUT2/37第三章数据挖掘概述1.DM背景和定义2.DM功能和过程3.DM现状和发展趋势
2024/11/26?TheInstituteofBusinessIntelligence,HFUT3/37背景数据挖掘是八十年代投资AI研究项目失败后,AI转入实际应用时提出的。它是一个新兴的,面向商业应用的AI研究。(AI(ArtificialIntelligence,人工智能))1989年8月,在美国底特律召开的第11届国际人工智能联合会议的专题讨论会上首次出现数据库中的知识发现(KnowledgeDiscoveryinDatabase,KDD)这一术语。随后,在1991年、1993年和1994年都举行KDD专题讨论会,汇集来自各个领域的研究人员和应用开发者,集中讨论数据统计、海量数据分析算法、知识表示、知识运用等问题。最初,数据挖掘是作为KDD中利用算法处理数据的一个步骤,其后逐渐演变成KDD的同义词。
2024/11/26?TheInstituteofBusinessIntelligence,HFUT4/37背景现在,人们往往不加区别地使用两者。KDD常常被称为数据挖掘(DataMining),实际两者是有区别的。一般将KDD中进行知识学习的阶段称为数据挖掘(DataMining),数据挖掘是KDD中一个非常重要的处理步骤。数据挖掘是近年来出现的客户关系管理(CustomerRelationshipManagement,CRM)、商业智能(BusinessIntelligence,BI)等热点领域的核心技术之一。
2024/11/26?TheInstituteofBusinessIntelligence,HFUT5/37技术角度定义数据挖掘(DataMining)是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。与数据挖掘相近的同义词包括:数据融合、数据分析和决策支持等。这一定义包括好几层含义:数据源必须是真实的、海量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。
2024/11/26?TheInstituteofBusinessIntelligence,HFUT6/37商业角度定义数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性信息。简言之,数据挖掘其实是一类深层次的数据分析方法。因此,数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证己知的规律性,并进一步将其模型化的有效方法。
2024/11/26?TheInstituteofBusinessIntelligence,HFUT7/37DataminingcontextBusinessintelligencemodelLevelsofdataanalysismethodhiddenshallowsurfacesimpledatabasequeriesstatisticalanalysisdatamining
2024/11/26?TheInstituteofBusinessIntelligence,HFUT8/37数据挖掘的演化进化阶段商业问题支持技术产品厂家产品特点数据搜集
(60年代)“过去五年中我的总收入是多少?”计算机、磁带和磁盘IBM,CDC提供历史性的、静态的数据信息数据访问
(80年代)“在新英格兰的分部去年三月的销售额是多少?”关系数据库(RDBMS),结构化查询语言(SQL),ODBCOracle、Sybase、Informix、IBM、MicrosoftOracle、Sybase、Informix、IBM、Microsoft在记录级提供历史性的、动态数据信息数据仓库;
决策支持
(90年代)“在新英格兰的分部去年三月的销售额是多少?波士顿据此可得出什么结论?”联机分析处理(OLAP)、多维数据库、数据仓库Pilot、Comshare、Arbor、Cognos、Microstrategy
您可能关注的文档
- 全科医学 全科医学哲学方法学习资料.ppt
- 全科医学 糖尿病处理计划学习资料.ppt
- 全科医学 医患沟通学习资料.ppt
- 商务智能 Chapter01-BI Overview学习课件.pptx
- 商务智能 Chapter06-Data Mining-AssociationAnalysis学习课件.pptx
- 商务智能 Chapter07-Text Mining学习课件.ppt
- 商务智能-Chapter01-BI Overview学习课件.pptx
- 商务智能-Chapter04-Data Mining-Clasification学习课件.pptx
- 商务智能-决策树在选课系统中的应用学习课件.ppt
- 实验应力分析 光弹性法在弹性联轴器挠性杆上的应用研究 学习课件.doc
- 2022-2023学年上海青浦区高一(上)期末英语试题及答案.pdf
- 2022-2023学年上海建平中学高一(上)期末政治试题及答案.pdf
- 2020-2021学年上海浦东区高一(上)信息技术综合练习卷及答案.docx
- 小学少先队干部职责.docx
- 社团建设论文-中小学生社团建设必要性、问题及相应措施.docx
- 高考近义成语专项模拟题汇编(含答案解析) .pdf
- 2024年医院精神科考试题库及答案1 .pdf
- 链脲佐菌素诱导的高血糖对大鼠肾、肝及眼睛的影响 .pdf
- PHP开源CMS-Drupal做视频站点(第1版)[原创] .pdf
- 银行业专业人员职业资格初级(个人贷款)模拟试卷17 .pdf
文档评论(0)