- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
数据挖掘技术综述
随着计算机、网络技术的发展,获得有关资料非常简单易行。但对数量
大、涉及面宽的数据,传统统计方法无法完成这类数据的分析。因此,一种
智能化的、综合应用各种统计分析、数据库、智能语言来分析庞大数据资料
的“数据挖掘”(DateMining)技术应运而生。本文主要介绍了数据挖掘
的基本概念以及数据挖掘的方法;本文对数据掘的应用及其发展前景也进行
了描述。
随着信息技术迅速发展,数据库的规模不断扩大,从而产生了大量的
数据。激增的数据背后隐藏着许多重要的信息,人们希望能够对其行更高
层次的分析,以便更好地利用这些数据。为给决策者提供一个统一的全局
视角,在许多领域建立了数据仓库。但大量的数据往往使人们无法辨别隐
藏在其中的能对决策提供支持的信息,而传统的查询、报表工具无法满足挖
掘这些信息的需求。因此,需要一种新的数据分析技术处理大量数据,并从
中抽取有价值的潜在知识,数据挖掘(DataMining)技术由此应运而生。
数据挖掘技术也正是伴随着数据仓库技术的发展而逐步完善起来的数据挖掘
是指从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程,这
些信息的表现形式为:规则、概念、规律及模式等。它可帮助决策者分析历
史数据及当前数据,并从中发现隐藏的关系和模式,进而预测未来可能发
生的行为。数据挖掘的过程也叫知识发现的过程,它是一门涉及面很广的
交叉性新兴学科,涉及到数据库、人工智能、数理统计、可视化、并行计算
等领域。数据挖掘是一种新的信息处理技术,其主要特点是
对数据
库中的大量数据进行抽取、转换、分析和其他模型化处理,并从中提
取辅助决策的关键性数据。数据挖掘是KDD(Knowledge
DiscoveryinDatabase)中的重要技术,它并不是用规范的数据库查询语言
(如SQL进行查询,而是对查询的内容进行模式的总结和内在规律的有哪些信誉好的足球投注网站。传
统的查询和报表处理只是得到事件发生的结果,并没有深入研究发生的原
因,而数据挖掘则主要了解发生的原因,并且以一定的置信度对未来进行
预测,用来为决策行为提供有利的支持。
数据挖掘的研究融合了多个不同学科领域的技术与成果,使得目前的
数据挖掘方法表现出多种多样的形式。从统计分析类的角度来说,统计分析
技术中使用的数据挖掘模型有线形分析和非线形分析、回归分析、逻辑回归
分析、单变量分析、多变量分析、时间序列分析、最近序列分析、最近邻算
法和聚类分析等方法。利用这些技术可以检查那些异常形式的数据,然
后,利用各种统计模型和数学模型解释这些数据,解释隐藏在这些数据背后
的市场规律和商业机会。知识发现类数据挖掘技术是一种与统计分析类数据
挖掘技术完全不同的挖掘技术,包括人工神经元网络、支持向量机、决策
树、遗传算法、粗糙集、规则发现和关联顺序等。
传统的统计学为数据挖掘提供了许多判别和回归分析方法,常用的有
贝叶斯推理、回归分析、方差分析等技术、贝叶斯推理是在知道新的信息后
修正数据集概率分布的基本工具,处理数据挖掘中的分类问题,回归分析用
来找到一个输入变量和输出变量关系的最佳模型,在回归分析中有用来描述
一个变量的变化趋势和别的变量值的关系的线性回归,还有用来为某些事件
发生的概率建模为预测变量集的对数回归、统计方法中的方差分析一般用于
分析估计回归直线的性能和自变量对最终回归的影响,是许多挖掘应用中有
力的工具之一。
关联规则是一种简单,实用的分析规则,它描述了一个事物中某些属
性同时出现的规律和模式,是数据挖掘中最成熟的主要技术之一。它是由
R.Agrawal等人首先提出的,最经典的关联规则的挖掘算法是Apriori,
该算法先挖出所有的频繁项集,然后,由频繁项集产生关联规则,许多关联
规则频繁项集的挖掘算法都是由它演变而来的,关联规则在数据挖掘领域应
用很广泛适合于在大型数据集中发现数据之间的有意义关系,原因之一是它
不受只选择一个因变量的限制,关联规则在数据挖掘领域最典型的应用是购
物篮分析。大多数关联规则挖掘算法能够无遗漏发现隐藏在所挖掘数据中的
所有关联关系,所挖掘出的关联规则量往往非
您可能关注的文档
最近下载
- 滁州市2017-2018年度一师一优课、一课一名师活动市级.PDF VIP
- 国家药监局关于发布免于临床评价医疗器械目录的通告(2023年第33号).pdf
- 杭州市西湖区各级文物保护单位一览表(2023版).docx VIP
- 杭州市萧山区各级文物保护单位一览表(2023版).docx VIP
- 《《亚克西巴郎》ppt课件》小学音乐苏少版二年级上册_3.ppt
- 幼儿园课件:小班数学形状《小熊饼干店》.ppt
- 杭州市上城区各级文物保护单位一览表(2023版).docx VIP
- 现代控制工程(第五版)卢伯英习题答案解析.pdf
- 2022年考研英语一必威体育精装版完整版真题.pdf
- 专业气象服务标准化工作.doc
文档评论(0)