网站大量收购独家精品文档,联系QQ:2885784924

《聚类学习算法在鸢尾花数据集分类中的应用研究》14000字.docx

《聚类学习算法在鸢尾花数据集分类中的应用研究》14000字.docx

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

聚类学习算法在鸢尾花数据集分类中的应用研究

摘要

伴随着数据信息收集与保存专业技术的迅速发展进步,全球各地的组织都能够保存很多的数据信息。正是因为数据信息量强大,旧有传统类型的人工研究分析专业技术碰到了发展进步瓶颈。怎样从大量数据信息里有效地发现行价值、有意义的数据信息,已逐渐发展成为了数据信息发掘的重要分析研究发展方向与推进其迅速发展进步的主要影响因素。聚类研究分析专业技术作为一门必威体育精装版的交叉专业学科,因为其在数据信息发掘过程里的特殊地位与在实际日常生活里的大规模推广和应用,已逐渐发展成为了一个十分活跃的分析研究分布方向。从截至当前,的实际状况分析,几乎所有的聚类运算方法都是针对指定的数据信息目标对象综合系统设计的,没有一类运算方法可以完成“放之四海而皆准”。每一类聚类运算方法都存在自身的优势与有限性。

在本文中,笔者简易详细论述了数据信息发掘的有关专业知识,详细论述了数据信息发掘的聚类研究分析模式,并且在这基础原理之上,对聚类研究分析运算方法展开了分类,详细论述了在聚类研究分析运算方法里各经典的聚类运算方法,在对聚类分析技术有了深入的了解之后,在聚类研究分析里对三类典型运算方法展开了简易的使用,给出了一种改进算法,进一步提高了k均值算法的聚类稳定性。

关键词:数据挖掘,聚类分析,鸢尾花数据集实验

目录

TOC\o1-3\h\z\u第一章引言 3

1.1课题研究背景及意义 3

1.2本文主要工作 6

1.3文章内容安排 7

第二章数据挖掘 8

2.1数据挖掘的起源 8

2.2数据挖掘的发展阶段 8

2.3数据挖掘的基本认识 9

2.4数据挖掘对象 10

2.5数据挖掘步骤 11

2.6数据挖掘技术 12

2.7数据挖掘存在的问题 13

第三章聚类学习算法在鸢尾花数据集中的应用 14

3.1聚类分析概念 14

3.2簇的类型 14

3.3聚类学习的算法分类 17

17

3.3.1基于划分的聚类方法(PartitioningMethods) 17

3.3.2基于层次的聚类方法 18

3.3.3基于密度的聚类方法(density-basedmethods) 18

3.3.4基于网格的聚类方法(grid-basedmethods) 18

3.3.5基于模型的聚类方法(Model-BasedMethods) 19

3.4性能度量——结果好坏的评估指标 19

3.4.1.性能度量指标——外部指标 19

3.4.2.距离计算公式 20

3.4.3.性能度量指标——内部指标 21

3.5三种聚类分析算法实验 22

3.5.1鸢尾花数据集分析 22

3.5.2k-means聚类实验 24

3.5.3层次聚类实验 24

3.5.4密度聚类实验 25

3.5.5聚类算法K-Means的改进 27

第四章.总结与展望 29

4.1总结 29

4.2展望 30

附录一:鸢尾花数据集 30

附录五:二分k-means代码 32

第一章引言

1.1课题研究背景及意义

REF_Re\r[1]面对大量的数据信息,正是因为旧有传统类型的人力研究分析模式没有办法不断展开,才形成了使用当代电脑计算机专业技术展开数据信息全面处理的分析研究。截至当前,早已公布了很多的数据信息发掘运算方法。就目前的研究状况来看,数据信息发掘的模式有许多,其重要的模式有分类、排布序列方式、关联发掘以及策略树与聚类研究分析等。因为数据信息发掘专业技术在日常使用过程里,己经获得了重大的成功而且其具备强大潜在的商业市场价值,进而促使数据信息发掘专业技术获取了许多分析研究行业领域的充分重视,从事参与数据信息发掘的工作人员也愈来愈多,因为服务网络、电子网络商务交易的发展进步也促使有关产业对数据信息发掘工作人员的使用要求愈来愈大,在未来的相当长的一定时间内,或将成为数据挖掘的时代。

REF_Re\r[2]数据对象之间的区别通常由数据对象的属性来定义。例如,可以为数值属性定义数据之间的距离。聚类分析的目的是根据数据的几个属性将数据划分为几个相似的对象集。在数据挖掘过程中使用了很多的聚类分析技术和方法,如在数据挖掘过程中相关数据的前期处理步骤,可以根据不同数据的特点,简单的数据结构或属性与低流量分析只有一个属性或数据可以直接在数据清洗预处理后集成到数据仓库中,少数庞杂的多维数据信息组成结构,聚类研究分析可应用在聚合数据信息,建设一个逻辑思维库,进而对庞杂组成结构的数据信息展开参考标准化

您可能关注的文档

文档评论(0)

02127123006 + 关注
实名认证
内容提供者

关注有哪些信誉好的足球投注网站

1亿VIP精品文档

相关文档