[信息与通信]数据挖掘中文版.doc

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[信息与通信]数据挖掘中文版

目录 第一章 引言 1.1 什么激发数据挖掘?为什么它是重要的? 1.2 什么是数据挖掘? 1.3 数据挖掘——在何种数据上进行? 1.3.1 关系数据库1.3.2 数据仓库1.3.3 事务数据库1.3.4 高级数据库系统和高级数据库应用1.4 数据挖掘功能——可以挖掘什么类型的模式? 1.4.1 概念/类描述:特征和区分1.4.2 关联分析1.4.3 分类和预测1.4.4 聚类分析1.4.5 局外者分析1.4.6 演变分析1.5 所有模式都是有趣的吗? 1.6 数据挖掘系统的分类1.7 数据挖掘的主要问题1.8 总结.习题 第二章 数据仓库和数据挖掘的 OLAP 技术2.1 什么是数据仓库? 2.2.1 操作数据库系统与数据仓库的区别2.1.2 但是,为什么需要一个分离的数据仓库. 2.2 多维数据模型2.2.1 由表和电子数据表到数据方2.2.2 星形、雪花和事实星座:多维数据库模式. 2.2.3 定义星形、雪花和事实星座的例子2.2.3 度量:它们的分类和计算.2.2.5 引入概念分2.2.6 多维数据模型上的 OLAP 操作2.2.7 查询多维数据库的星形网查询模型. 2.3 数据仓库的系统结构2.3.1 数据仓库的设计步骤和结构2.3.2 三层数据仓库结构2.3.3 OLAP 服务器类型:ROLAP、MOLAP 、HOLAP 的比较2.4 数据仓库实现2.4.1 数据方的有效计算2.4.2 索引 OLAP 数据2.4.3 OLAP 查询的有效处理2.4.4 元数据存储2.5 数据方技术的进一步发展2.5.1 数据方发现驱动的探查2.5.2 多粒度上的复杂聚集: 多特征方2.5.3 其它进展2.6 由数据仓库到数据挖掘2.6.1 数据仓库的使用2.6.2 由联机分析处理到联机分析挖掘2.7 总结 习题 第三章 数据预处理3.1 为什么要预处理数据? 3.2 数据清理3.2.1 遗漏值3.2.2 噪音数据3.3 数据集成和变换3.3.1 数据集成3.3.2 数据变换3.4 数据归约3.4.1 数据方聚集3.4.2 维归约3.4.3 数据压缩3.4.4 数值归约3.5 离散化和概念分层产生3.5.1 数值数据的离散化和概念分层产生3.5.2 分类数据的概念分层产生. 3.6 总结习题 第一章 引言 本书是一个导论,介绍什么是数据挖掘,什么是数据库中知识发现。书中的材料从数据库角度 提供,特别强调发现隐藏在大型数据集中有趣数据模式的数据挖掘基本概念和技术。所讨论的实现 方法主要面向可规模化的、有效的数据挖掘工具开发。本章,你将学习数据挖掘如何成为数据库技术自然进化的一部分,为什么数据挖掘是重要的,以及如何定义数据挖掘。你将学习数据挖掘系统的一般结构,并考察挖掘的数据种类,可以发现的数据类型,以及什么样的模式提供有用的知识。除学习数据挖掘系统的分类之外,你将看到建立未来的数据挖掘工具所面临的挑战性问题。 1.1 什么激发数据挖掘?为什么它是重要的? 需要是发明之母。近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理、生产控制、市场分析、工程设计和科学探索等。 数据挖掘是信息技术自然进化的结果。进化过程的见证是数据库工业界开发以下功能(图 1.1):数据收集和数据库创建,数据管理(包括数据存储和提取,数据库事务处理),以及数据分析与理解(涉及数据仓库和数据挖掘)。例如,数据收集和数据库创建机制的早期开发已成为稍后数据存储和提取、查询和事务处理有效机制开发的必备基础。随着提供查询和事务处理的大量数据库系统广泛付诸实践,数据分析和理解自然成为下一个目标。 自60 年代以来,数据库和信息技术已经系统地从原始的文件处理进化到复杂的、功能强大的数据库系统。自 70 年代以来,数据库系统的研究和开发已经从层次和网状数据库发展到开发关系数据库系统(数据存放在关系表结构中;见 1.3.1 小节)、数据建模工具、索引和数据组织技术。此外, 用户通过查询语言、用户界面、优化的查询处理和事务管理,可以方便、灵活地访问数据。联机事务处理(OLTP)将查询看作只读事务,对于关系技术的发展和广泛地将关系技术作为大量数据的有效存储、提取和管理的主要工具作出了重要贡献。 自80 年代中期以来,数据库技术的特点是广泛接受关系技术,研究和开发新的、功能强大的数据库系统。这些使用了先进的数据模型,如扩充关系、面向对象、对象-关系和演绎

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档