数据挖掘技术在商业领域中的应用.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘技术在商业领域中的应用 作者:唐 镜 指导老师: 摘要:数据挖掘(Data Mining)就是从大量的不完全的、有噪声的、模糊的、随机的数据库中实际应用数据中提取隐含信息和知识,它利用了数据库、人工智能和数理统计等多方面的技术,是一类深层次的数据分析方法。随着网络、数据库技术的迅速发畏以及数据库管理系统的广泛应用,人们积累的数据越来越多。我们已经被淹没在数据和信息的汪洋大海中。人们需要有新的、更有效的方法对各种大量的数据进行分析、提取以挖掘其潜能,数据挖掘正是在这样的应用需求环境下产生并迅速发展起来的,它的出现为智能地把海量的数据转化为有用的信息和知识提供了新的思路和手段。数据挖掘不仅能对过去的数据进行查询和变动,而且能够找出过去诸数据之间的潜在联系,从而促进信息的传递.数据挖掘在商业领域应用广泛,搞好数据挖掘可以带来巨大商机。数据挖掘是当前数据库和信息决策领域的最前沿研究方向之一。从知识发现和数据挖掘的概念出发,同时对数据挖掘在商业领域中的应用及发展进行了阐述。 关键词:数据挖掘,数据挖掘技术、过程,商业应用 目前,数据挖掘技术正以前所未有的速度发展,并且扩大着用户群体,在未来越来越激烈的市场竞争中,拥有数据挖掘技术必将比别人获得更快速的反应,赢得更多的商业机会。现在世界上的主要数据库厂商纷纷开始把数据挖掘功能集成到自己的产品中,加快数据挖掘技术的发展。我国在这一领域正处在研究开发阶段,加快研究数据挖掘技术,并把它应用于电子商务中,应用到更多行业中,势必会有更好的商业机会和更光明的前景。 一 什么是数据挖掘 数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。简而言之,数据挖掘其实是一类深层次的数据分析方法。从这个角度数据挖掘也可以描述为:按企业制定的业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。简单的说是传统决策和支撑系统的升级和改进,使之更有效,更准确。对于那些决策者明确了解的信息,可以用查询、联机分析处理或其他工具直接获取。而另外一些隐藏在大量数据中的关系、趋势等信息,就需要通过数据挖掘技术来完成。 二 什么是数据挖掘技术 数据挖掘技术是人们长期对数据库技术进行研究和开发的结果,其中数据仓库技术的发展与数据挖掘有着密切的关系。大部分情况下,数据挖掘都要先把数据从数据仓库中拿到数据挖掘库或数据集市中,因为数据仓库会对数据进行清理,并会解决数据的不一致问题,这会给数据挖掘带来很多好处。此外数据挖掘还利用了人工智能(AI)和统计分析的进步所带来的好处,这两门学科都致力于模式发现和预测。数据库、人工智能和数理统计是数据挖掘技术的三大支柱。由于数据挖掘所发现的知识的不同,其所利用的技术也有所不同。 数据挖掘技术涉及到多种学科技术,如:数据库技术、人工智能、数理统计学、模式识别、神经网络及计算机软硬件技术的发展、数据可视化、信息检索及空间数据分析等,数据挖掘技术必能在更多的领域内取得更广泛的应用。 三 数据挖掘的过程 数据挖掘过程一般由三个主要的阶段组成:数据准备、挖掘挖掘、结果表达和解释。知识的发现可以描述为这三个阶段的反复过程。 3.1 数据准备 数据准备又可以分为3个子步骤:数据选取、数据预处理、数据转换。 (1) 数据选择。有哪些信誉好的足球投注网站所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据。 (2) 数据预处理。研究数据的质量,进行数据的集成、变换、归约、压缩等.为进一步的分析作准备,并确定将要进行的挖掘操作的类型。 (3) 数据转换。将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的,这是数据挖掘成功的关键。 3.2 数据挖掘 做数据挖掘研究的人,往往把主要的精力用于改进现有算法和研究新算法上。人们都知道数据准备是必不可少的一步,但很少有人去真正花时间和精力去研究。其实数据挖掘最后成功与失败,是否有经济效益,数据准备起到了至关重要的作用。数据准备包含很多方面:一是从多种数据源去综合数据挖掘所需要的数据,保证数据的综合性、易用性、数据的质量和数据的时效性,这有可能要用到数据仓库的思想和技术;另一方面就是如何从现有数据中衍生出所需要的指标,这主要取决于数据挖掘者的分析经验和工具的方便性。 3.3 结果表述和解释 根据最终用户的决策目的对提取的信息进行分析,把最有价值的信息区分出来,并且通过决策支持工具提交给决策者。因此,这一步骤的任务不仅是把结果表达

文档评论(0)

yurixiang1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档