网站大量收购独家精品文档,联系QQ:2885784924

数据挖掘算法优研究与应用.pdf

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘算法优研究与应用

摘要 lIlllIlllllIIIIJIllllIIIJIIIIIIIIJillIllf— ’ Y2579599 摘要 随着现代社会的高速发展,各种各样的信息以及数据呈现爆炸式的增长, 积累的信息和数据越来越多。这些存放在媒介中的海量数据,在没有外部工具 的帮助下,人们很难从这些巨大的数据量中找到有用的信息,这些数据将成为 垃圾数据。 数据挖掘技术的出现,很好地解决了这个问题。数据挖掘技术可以从大量 的数据中分析学习数据中对用户有用的模式和规则,利用这些学习到的模式和 规则,当有新的样本数据的时候,可以根据已有的模式和规则来预测样本数据 可能的特性。 数据挖掘分类是数据挖掘的重要步骤之一,而在数据挖掘分类算法中,决 策树分类算法是数据挖掘中应用较广的一种分类算法,它主要有ID3分类算法 和c4.5分类算法,ID3有着简单易操作的优点,但也有着偏向于处理小数据集, 以及只能处理离散属性的缺点,c4.5算法可以很好的弥补ID3算法对连续属性 的处理不足的缺点,但C4.5算法同样有着处理增量学习和大数据量问题的不足。 解决决策树算法的增量学习问题就是本文研究的切入点。 本文主要对数据挖掘中的分类算法进行详细的介绍和描述,然后将分类算 法和数据挖掘增量学习技术相结合,提出了一种增量式决策树算法来解决决策 树经典算法的增量学习问题,并对该算法进行了实验数据分析。针对数据挖掘 中常见的分类算法,包括:决策树分类算法、最近邻居算法和神经网络这三种 最常见分类算法,进行了详细的介绍和描述,并对这三种算法的分类性能进行 了比较研究。本文选取决策树分类算法中ID3算法和c4.5算法进行详细的研究, 详尽的介绍了这两种分类算法的基本步骤,包括决策树生成和决策树剪枝的基 本步骤并列举实例来演示算法的原理。同时分析了ID3算法和c4.5算法的优缺 点;最后,根据前面对ID3算法和c4.5算法的性能和优缺点分析,综合贝叶斯 分类算法的增量学习特性,提出了一种增量式决策树算法,并通过分析实验数 据,该算法很好地解决了决策树算法的增量学习问题。 关键词:数据挖掘,分类算法,决策树,增量学习 ABSTRA(了 ABSTRACT anddata Withthe ofmodern kindsofinformation rapiddevelopmentsociety,all in the of havethe amountsofdatamedium,without explosivegrowth.Thehuge help find informationfromthe amountof external istoohardto usefull tools,it huge andsummarize. data.Thesearefarmorethanthehumantounderstand ability The ofData the well.Data

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档