网站大量收购独家精品文档,联系QQ:2885784924

山东大学计算机研究生期末考试数据分析重点总结.docxVIP

山东大学计算机研究生期末考试数据分析重点总结.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
山东大学计算机研究生期末考试数据分析重点总结

1.数据仓库的四个特征。数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于决策支持(Decision Making Support)面向主题:操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的分析主题域进行组织的。主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类后进行分析利用的抽象。在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象,是针对某一决策问题而设置的。集成的:数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。相对稳定的:数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。反映历史变化:数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。2.商业智能(BI)中运用了那些计算机技术,这些技术在商业智能中的作用。商业智能这一概念最早是由Gartner公司于1996年提出来的。根据Gartner公司的定义,商业智能(简称BI)是对商业信息的搜集、管理和分析过程,目的是使企业的各级决策者获得知识或洞察力,促使他们做出对企业更有利的决策。1)。从作用说,BI好比“数据炼油厂”,即把商业活动中累积的数据加工成可用于支持商业决策的信息。其主要目标是将企业所掌握的信息转换成竞争优势,提高企业决策能力、决策效率、决策准确性。2)。从形态上说,BI实际上是帮助企业提高决策能力和运营能力的概念、方法、过程以及软件的集合。3)。从技术上说,主要包括数据仓库、联机分析处理、数据挖掘三大技术,还包括数据展现、绩效管理、指标管理以及其他用于统计和分析商业数据的先进的信息技术。OLAP的多维分析在多维结构上进行切片、切块、钻取等操作。OLAP的典型应用,通过商业活动变化的查询发现问题,经过追踪查询找出问题出现的原因,达到辅助决策的作用。数据挖掘数据挖掘使用聚类(如神经网络聚类)、分类(如决策树分类)、预测、关联分析等带有探索性的建模功能。任务在于从海量数据中寻找不平常的且有用的商业运作模型。多维数据分析(OLAP,联机分析处理):交互式、高效访问多维数据集;察看长期趋势;分析并探查存在的问题;钻取到细节,察看不同维度、不同层次的信息;便捷实现数据集的复杂分析流程。数据挖掘往往针对特定的数据、特定的问题,选择一种或者多种挖掘算法,找到数据下面隐藏的规律,这些规律往往被用来预测、支持决策。数据报表、数据分析、数据挖掘是BI的三个层面。我们相信未来几年的趋势是:越来越多的企业在数据报表的基础上,会进入数据分析与数据挖掘的领域。商业智能所带来的决策支持功能,会给我们带来越来越明显的效益。3.比较数据库的数据字典和数据仓库的原数据。在数据库中数据字典(Data dictionary)是一种用户可以访问的记录数据库和应用程序元数据的目录。主动数据字典是指在对数据库或应用程序结构进行修改时,其内容可以由DBMS自动更新的数据字典。被动数据字典是指修改时必须手工更新其内容的数据字典。在数据仓库系统中,元数据是关于数据仓库的数据,指在数据仓库建设过程中所产生的有关数据源定义、目标定义、转换规则等相关的关键数据,同时元数据还包含关于数据含义的商业信息。元数据贯穿于整个数据仓库应用中。数据仓库的元数据除对数据仓库中数据的描述(数据仓库字典)外,还有以下三类元数据:(1) 关于数据源的元数据(2) 关于抽取和转换的元数据(3) 关于最终用户的元数据4.联机分析处理(On Line Analytical Processing,OLAP)在数据仓库系统中,联机分析处理是重要的数据分析工具。OLAP的基本思想是从多方面和多角度以多维的形式来观察企业的状态、了解企业的变化,辅助决策。OLAP是在OLTP的基础上发展起来的。OLTP是以数据库为基础的,面对的是操作人员和低层管理人员,对基本数据的查询和增、删、改等进行处理。OLAP是以数据仓库为基础的数据分析处理。它有两个特点:一是在线性(On Line),由客户机/服务器这种体系结构来完成的;二是多维分析,这是OLAP的核心所在。OLAP是针对某个特定的主题进行联机数据访问、处理和分析,

文档评论(0)

2017ll + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档