网站大量收购闲置独家精品文档,联系QQ:2885784924

编计算机导论张丽娜周苏王文金海溶第12章数据库数据仓库与数据挖掘.ppt

编计算机导论张丽娜周苏王文金海溶第12章数据库数据仓库与数据挖掘.ppt

  1. 1、本文档共105页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PPT研究院 POWERPOINT ACADEMY * * 12.4.2 数据仓库的组成 数据仓库由数据仓库数据库、数据抽取工具、元数据等内容组成。 1) 数据仓库数据库。这是整个数据仓库环境的核心,是数据存放的地方,提供对数据检索的支持。相对于操纵型数据库来说,其突出特点是对海量数据的支持和快速的检索技术。 2) 数据抽取工具。把数据从各种各样的存储方式中拿出来,进行必要的转化、整理,再存放到数据仓库内。对各种不同数据存储方式的访问能力是数据抽取工具的关键,以访问不同的数据。数据转换包括删除对决策应用没有意义的数据段;转换到统一的数据名称和定义;计算统计和衍生数据;给缺值数据赋以缺省值;把不同的数据定义方式统一等。 12.4.2 数据仓库的组成 3) 元数据。是指描述数据仓库内数据的结构和建立方法的数据。可将其按用途不同分为两类,即技术元数据和商业元数据。 技术元数据是数据仓库的设计和管理人员用于开发和日常管理数据仓库时用的数据。包括数据源信息、数据转换的描述、数据仓库内对象和数据结构的定义、数据清理和数据更新的规则、源数据到目的数据的映射、用户访问权限、数据备份历史记录、数据导入历史记录、信息发布历史记录等。 商业元数据从商业业务的角度描述了数据仓库中的数据。包括业务主题的描述、包含的数据、查询、报表等。 12.4.2 数据仓库的组成 元数据为访问数据仓库提供了一个信息目录,这个目录全面描述了数据仓库中有什么数据、这些数据是怎么得到的和怎么访问这些数据,它是数据仓库运行和维护的中心,数据仓库服务器利用它来存储和更新数据,用户通过它来了解和访问数据。 12.4.2 数据仓库的组成 4) 访问工具。为用户访问数据仓库提供手段。有数据查询和报表工具、应用开发工具、管理信息系统 (EIS) 工具、在线分析 (OLAP) 工具、数据挖掘工具等。 5) 数据集市 (Data Marts) 。是指为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据。在数据仓库的实施过程中,往往可以从一个部门的数据集市着手,以后再用几个数据集市组成一个完整的数据仓库。需要注意的是,在实施不同的数据集市时,同一含义的字段定义一定要相容,这样以后实施数据仓库时才不会造成大麻烦。 12.4.2 数据仓库的组成 6) 数据仓库管理。包括安全和特权管理、跟踪数据的更新、数据质量检查、管理和更新元数据、审计和报告数据仓库的使用和状态、删除数据、复制/分割和分发数据、备份和恢复、存储管理等。 7) 信息发布系统。把数据仓库中的数据或其他相关的数据发送给不同的地点或用户。基于Web的信息发布系统是对付多用户访问的最有效方法。 12.4.3 数据仓库与数据库 作为数据管理手段,传统的数据库技术是单一的数据资源,主要用于事务处理,也称为操作型处理。它以数据库为中心,进行从事务处理、批处理到决策分析的各种类型的数据处理工作。用户关心的是响应时间、数据的安全性和完整性。 12.4.3 数据仓库与数据库 数据仓库用于决策支持,也称分析型处理,它是建立决策支持系统 (DSS) 的基础。数据仓库对关系数据库的联机分析能力提出了更高的要求,采用普通关系型数据库作为数据仓库在功能和性能上都是不够的,它们必须有专门的改进。因此,数据仓库与数据库的区别不仅仅表现在应用的方法和目的方面,同时也涉及到产品和配置上的不同。 12.4.3 数据仓库与数据库 因此,数据仓库是一种新的数据处理体系结构和信息管理技术,它是企业内部各部门业务数据进行统一和综合的中央数据仓库。它为企业决策支持系统和行政信息系统提供所需的信息,为预测利润、风险分析、市场分析以及加强客户服务与营销活动等管理决策提供支持。 12.4.3 数据仓库与数据库 要提高分析与决策的效率和有效性,分析型处理及其数据必须与操作型处理及其数据相分离,必须把分析型数据从事务处理环境中提取出来,按照DSS处理的需要进行重新组织,建立单独的分析处理环境。数据仓库正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术。 12.5 数据挖掘 作为决策支持新技术,数据挖掘也和数据仓库一样,近年来得到了迅速发展。 12.5 数据挖掘 数据挖掘 (DM,Data Mining,也称数据开采) 是从大型数据库或数据仓库中发现并提取隐藏在其中的有用信息或知识信息的一种技术,它主要是利用某些特定的知识发现 (KDD,Knowledge Discovery in Database) 算法,在一定的运算效率的限制内,从数据对象 (例如数据库或数据仓库,也可以是文件系统或其他任何组织在一起的数据集合) 中发现有关的知识。它帮助决策者寻找数据间潜在的关联,发现被忽略的因素。而这些信息和因素对预测趋势和决策

文档评论(0)

开心农场 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档