- 1、本文档共12页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《数据仓库与数据挖掘》课程考核论文? ?
数据仓库与数据挖掘数据仓库技术是数据库技术的一个重要发展方向。而利用数据挖掘技术将数据加工转换成有价值的信息供决策人使用成为研究热点问题。本文综述了数据仓库和数据挖掘的概念、数据挖掘的算法,关键词:数据仓库、数据挖掘Data warehouse and data mining Abstract: The technology of data warehouse is an important branch of the technology of database. It’s an hot research to transmit the data by the tool of data warehouse technology into useful information for the deciders’ use. The paper gives a summery for the definition of data warehouse and data mining 、the arithmetic of data mining ,and the paper gives a detailed argument on the methods of concerning fields.Key words: data warehouse、data mining 1
2 数据仓库 1
2.1数据仓库概念 1
2.2数据仓库特点 2
2.2.1面向主题 3
2.2.2 集成 3
2.2.3 数据的稳定性 3
2.2.4 随时间变化 3
2.3数据仓库的结构组成 2
3数据挖掘 3
3.1数据挖掘的概念 4
3.2数据挖掘的算法 13
3.2.1 决策树算法 8
3.2.2 朴素贝叶斯 9
3.2.3 支持向量算法 9
4 基于数据仓库的数据挖掘的应用 13
5 结束语
参考文献 23
1引言
一切事物的产生都是由需求驱动的,数十年来,无休止的数据循环带来了日益增长的数据,如何保存这些数据成了信息系统专家面临的一个难题;另外,如何生成、保存以及检索和分析数据也遇到了困难,即目前用于对这些数据进行分析处理的工具很少,使我们很难获得隐藏在这些数据之后的数据的整体特征及对其发展趋势进行有效的预测。而这些信息在决策制定的过程中具有十分重要的参考价值。这些需求促成了功能强大的新工具的开发,如数据仓库(data warehouse)、数据挖掘(data mining)和联机分析处理(OLAP)等。本人利用数据仓库和数据挖掘的理论,做了2数据仓库2.1数据仓库的概念数据仓库的概念是由数据仓库之父W.H.Inmon提出来的,他指出数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持经营管理中的决策制定过程。数据仓库可将各种数据整合在一个中央存储库中,并重新整理和排序。一般来说,控制程序员会在非忙碌时间将数据批量转换到中央存储库,当数据被导入数据仓库后,借助OLAP等数据挖掘工具,管理者和其他用户可轻松的操作数据库并得到所需的商务数据。2.2 数据仓库的特点 从数据仓库的概念中可看出数据仓库有四个重要的特点 2.2.1面向主题 数据仓库中的数据是按照一定的主题域进行组织的。主题是一个抽象的概念,是在较高层次上将企业的信息系统中的数据综合、归类后进行分析利用的抽象。 2.2.2集成 数据仓库中的数据从原来分散的各个子系统中提取出来,经过综合、计算、抛弃分析处理不需要的数据项,增加一些可能涉及的外部数据,消除数据的不一致和错误之处以保证数据的质量。 2.2.3数据的稳定性 数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将长期保留,通常只对进行数据加载和刷新工作。 2.2.4随时间变化 数据仓库的数据不可更新是针对应用而言的,并不是说数据自进入数据仓库后就永远不变。当数据超过数据仓库的存储期限或对分析无用时就被从数据仓库中删除掉。, 底层为数据仓库服务器, 中间层为OLAP服务器, 顶层为前端工具。底层的数据仓库服务器一般是一个关系数据库系统, 数据仓库服务器从操作型数据库或外部数据源提取数据, 对数据进行清理、转换和集成等, 然后装入数据仓库中中间层的OLAP服务器的实现可以是关系型OLAP, 即扩充的关系型DBMS, 提供对多维数据的支持。也可以是多维的OLAP服务器, 它是一种特殊的服务器, 直接支持多维数据的存储和操作。顶层的前端工具包括查询和报表工具、分析工具及数据挖掘工具等。图所示是一个数据仓库的简单体系结构
3.数据挖掘数据挖掘是通过自动或半自动化的工具对大量的数据进行探索和分析的过程,
文档评论(0)