网站大量收购闲置独家精品文档,联系QQ:2885784924

2025年对数据挖掘与数据仓库的认识.pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

古之立大事者,不惟有超世之才,亦必有坚忍不拔之志。——苏轼

对数据挖掘与数据仓库的认识

···202520257姓名:郑仕生班级:08计算机科学与技术2班

对数据挖掘与数据仓库的认识

随着市场竞争的越来越激烈,商业环境中的信息越来越密集,企

业必须能够深入灵活利用积累的大量数据挖掘潜在的规律,提高决策

质量,把握和发现市场机遇,提升企业的竞争力。实施商务智能是一

个十分复杂的过程,成功的商务智能应该具备三个要素:商业需求、

大量的数据和实现商务智能的技术。因此,商务智能有其特定的实施

方法,它包含对企业商务智能需求的明确、对企业现有信息化情况的

了解和对各种商务智能技术的充分掌握三个方面。

目前业界对数据仓库的概念没有一个统一的定义,在我认为数据

仓库(DataWarehouse)是集成的、稳定的、随时间变化的数据集合,

用以支持管理决策系统的过程。由此可见,数据仓库是一个综合的解

决方案,是对原始的操作数据进行各种处理并转换成有用信息的处理

过程,它主要用来帮助业务主管部门做出更符合业务发展规律的决策,

用以指导卷烟销售。数据仓库的建设需要综合应用、决策权、数据库、

数理统计等多项技术。世界上许多著名公司都推出了类似的数据产品,

包括Oracle、Informix、Sybase和IBM等等。目前我们的卷烟销售

模式经历了从集中到分散再到集中的转变,在去年取消法人资格,集

中访销的模式下,泰州分公司也正式使用了江苏省烟草电子营销管理

系统,配必Oracle数据库,使系统的稳定性得到了保证。如何从庞大

销售信息资料库中寻找出更有价值的信息,数据挖掘便成了烟草信息

化的重要组成部分。

数据挖掘(DataMine)简称DM,其本质就是发现数据实质与数据

间的关系的探索过程,找出潜在于数据中的现实事务的规律和趋势,

进而把感觉转化为事实。数据挖掘大致可分为三类:关系发现、模式

发现、趋势行为发现。数据挖掘技术主要应用于决策支持系统(DSS)。

数据挖掘指的是从大型数据库或数据仓库中提取人们感兴趣的知识,

这些知识是隐含的、事先未知的潜在有用信息。大部分的人认为数据

以家为家,以乡为乡,以国为国,以天下为天下。——《管子》

挖掘和数据库是等价的概念。数据挖掘是随着科学技术的迅速发展、

数据库规模的日益扩大以及人们对数据库中潜在信息资源的需求而迅

速发展起来的。它是数据库技术、人工智能、机器学习、统计分析、

模糊逻辑等学科相结合的产物。数据挖掘的对象不仅是结构化数据库,

也可以是半结构化的超文本文件,甚至是非结构化的多媒体。而数据

仓库上面的数据挖掘,将是数据挖掘技术应用的主流。

数据挖掘一般由数据准备、挖掘操作、结果表达和解释三个主要

阶段组成。在数据准备阶段应集成多个运作数据源中的数据,解决语

义模糊性、处理遗漏数据、清洗脏数据。挖掘阶段是一个假设产生、

合成、修正和验证传播的过程,也是上述三个阶段的核心。结果表达

和解释阶段根据最终用户的决策目的把提取的有用信息正确地表达出

来。

数据挖掘的方法和技术可大致划分为三类:统计分析、知识发现、

可视化技术等。统计分析用于检查异常形式的数据,然后利用统计模

型和数学模型来解释这些数据,统计分析方法是目前最成熟的数据挖

掘工具。而知识发现则着眼于发现大量数据记录中潜在的有用信息或

新的知识,属于所谓“发现驱动”的数据挖

掘技术途经。知识发现常用的方法有人工神经网络、决策树

文档评论(0)

132****3702 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档