- 1、本文档共40页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八章数据挖掘技术概述
2015/6/3 1
8.1 背景
数据挖掘的替换词
数据库中的知识挖掘/发现(KDD)
知识提炼
数据/模式分析
数据考古
数据捕捞、信息收获等等。
2015/6/3 2
8.2 数据挖掘定义
数据挖掘(Data Mining):是指从模糊、随机、有
噪声的大型数据集中提取人们感兴趣的知识,这些
知识是隐含的、具有一定可信度的、对用户而言是
新颖的且有潜在价值的知识,提取的知识表示为概
念、规则、模式等多种形式。
这一定义包括好几层含义:
数据源必须是真实的、海量的、含噪声的;
发现的是用户感兴趣、新颖的知识;
发现的知识要可接受、可理解、可运用、有价值;
知识的形式可以是概念、规则、模式等形式。
2015/6/3 3
8.2 数据挖掘定义
数据挖掘环境
数据分析的层次 方法
simple database queries
Surface (表面)
statistical analysis
Shallow (潜在)
Hidden (隐藏) data mining
2015/6/3 4
数据挖掘的演化
进化阶段 商业问题 支持技术 产品厂家 产品特点
提供历史性的、
数据搜集 “过去五年中我的总
计算机、磁带和磁盘 IBM,CDC 静态的数据信
(60年代) 收入是多少?”
息
关系数据库(RDBMS),
“在新英格兰的分部 Oracle、Sybase、在记录级提供
数据访问 结构化查询语言(SQL),
去年三月的销售额是 Informix、IBM、 历史性的、动
(80年代) ODBC Oracle、Sybase、
多少?” Microsoft 态数据信息
Informix、IBM、Microsoft
“在新英格兰的分部 在各种层次上
数据仓库;
文档评论(0)