- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
对数据挖掘与数据仓库的认识
学号:081401237姓名:郑仕生班级:08计算机科学与技术2班
对数据挖掘与数据仓库的认识
随着市场竞争的越来越激烈,商业环境中的信息越来越密集,企
业必须能够深入灵活利用积累的大量数据挖掘潜在的规律,提高决策
质量,把握和发现市场机遇,提升企业的竞争力。实施商务智能是一
个十分复杂的过程,成功的商务智能应该具备三个要素:商业需求、
大量的数据和实现商务智能的技术。因此,商务智能有其特定的实施
方法,它包含对企业商务智能需求的明确、对企业现有信息化情况的
了解和对各种商务智能技术的充分掌握三个方面。
目前业界对数据仓库的概念没有一个统一的定义,在我认为数据
仓库(DataWarehouse)是集成的、稳定的、随时间变化的数据集合,
用以支持管理决策系统的过程。由此可见,数据仓库是一个综合的解
决方案,是对原始的操作数据进行各种处理并转换成有用信息的处理
过程,它主要用来帮助业务主管部门做出更符合业务发展规律的决策,
用以指导卷烟销售。数据仓库的建设需要综合应用、决策权、数据库、
数理统计等多项技术。世界上许多著名公司都推出了类似的数据产品,
包括Oracle、Informix、Sybase和IBM等等。目前我们的卷烟销售
模式经历了从集中到分散再到集中的转变,在去年取消法人资格,集
中访销的模式下,泰州分公司也正式使用了江苏省烟草电子营销管理
系统,配必Oracle数据库,使系统的稳定性得到了保证。如何从庞大
销售信息资料库中寻找出更有价值的信息,数据挖掘便成了烟草信息
化的重要组成部分。
数据挖掘(DataMine)简称DM,其本质就是发现数据实质与数据
间的关系的探索过程,找出潜在于数据中的现实事务的规律和趋势,
进而把感觉转化为事实。数据挖掘大致可分为三类:关系发现、模式
发现、趋势行为发现。数据挖掘技术主要应用于决策支持系统(DSS)。
数据挖掘指的是从大型数据库或数据仓库中提取人们感兴趣的知识,
这些知识是隐含的、事先未知的潜在有用信息。大部分的人认为数据
挖掘和数据库是等价的概念。数据挖掘是随着科学技术的迅速发展、
数据库规模的日益扩大以及人们对数据库中潜在信息资源的需求而迅
速发展起来的。它是数据库技术、人工智能、机器学习、统计分析、
模糊逻辑等学科相结合的产物。数据挖掘的对象不仅是结构化数据库,
也可以是半结构化的超文本文件,甚至是非结构化的多媒体。而数据
仓库上面的数据挖掘,将是数据挖掘技术应用的主流。
数据挖掘一般由数据准备、挖掘操作、结果表达和解释三个主要
阶段组成。在数据准备阶段应集成多个运作数据源中的数据,解决语
义模糊性、处理遗漏数据、清洗脏数据。挖掘阶段是一个假设产生、
合成、修正和验证传播的过程,也是上述三个阶段的核心。结果表达
和解释阶段根据最终用户的决策目的把提取的有用信息正确地表达出
来。
数据挖掘的方法和技术可大致划分为三类:统计分析、知识发现、
可视化技术等。统计分析用于检查异常形式的数据,然后利用统计模
型和数学模型来解释这些数据,统计分析方法是目前最成熟的数据挖
掘工具。而知识发现则着眼于发现大量数据记录中潜在的有用信息或
新的知识,属于所谓“发现驱动”的数据挖
掘技术途经。知识发现常用的方法有人工神经网络、决策树、遗
传算法、模糊计算或模糊推理等。数据质量、可视化数据的能力、极
大数据库尺寸、数据挖掘者的技能、数据的粒度都是影响知识发现方
法的重要因素。可视化技术则采用直观的图形方式将信息模式、数据
的关联或趋势呈现给决策者,决策者可以通过可视化技术交互式地分
析数据关系。
由于数据仓库在规模、历史数据、数据集成和综合性、查询支持
等方面都和传统的数据库有着本质的区别,所以数据仓库为数据挖掘
提供了更广阔的活动空间。数据仓库完成了数据的收集、集成、存储、
管理等工作,数据挖掘面对的是经初步加工的数据,使得数据挖掘更
专注于知识的发现;另一方面,由于数据仓库所具有的新特点,又对数
据挖掘技术提出了更高的要求。所以,数据仓库技术的发展必须和数
据挖掘技术有机地结合起来。
数据挖掘是一种潜在的功能强大的新技术,它能帮助企业在他们
的数据仓库中找到最重要的信息。数据挖掘工具能预测未来趋势和行
为,使得商务活动具有前瞻性,并作出具有知识驱动的决策。数据挖
掘所提供的自动的预期分析已经
您可能关注的文档
- 广东建筑与装饰工程定额.pdf
- 大班毕业典礼主题的策划方案范本.pdf
- 2023年我国煤炭行业发展现状分析:前景不容乐观.pdf
- 项目部经理岗位职责.pdf
- TLC-JC-TJ011 钢板检验报告模板 VA.0.pdf
- 小学美术_设计文化衫教学设计学情分析教材分析课后反思.pdf
- 预防处置群体性事件应急预案.pdf
- 一年级阅读理解50篇(打印版).pdf
- 楼梯的尺寸规范.pdf
- 中职旅游专业学生中文导游资格证考证教学策略.pdf
- DB12 046.89-2011 产品单位产量综合电耗计算方法及限额 第89部分:手机 .docx
- DB12 046.88-2011 产品单位产量综合电耗计算方法及限额 第88部分:晶振 .docx
- DB12T 419-2010 无公害农产品 核桃栽培管理技术规范 .docx
- DB12T 417-2010 沙化和荒漠化监测技术规程.docx
- DB12T 449-2011 民用建筑四防门通用技术条件.docx
- DB12 046.100-2011 产品单位产量综合能耗计算方法及限额 第100部分: 果汁饮料 .docx
- DB12T 427-2010 葱姜蒜中205种农药多残留测定方法-GCMS法.docx
- DB12T 421-2010 有机农产品 甘薯有机栽培技术规范.docx
- DB12T 426-2010 蔬菜水果中205种农药多残留测定方法-GCMS法 .docx
- 《老年人身体康复》精品课件——项目6 中国传统康复技术.pptx
文档评论(0)