K-Means算法的研究与改进.PDF

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
K-Means算法的研究与改进.PDF

第22卷  第10期 计 算机 技 术 与发 展 Vol.22  No.10 2012年10月                     COMPUTERTECHNOLOGY AND DEVELOPMENT                    Oct.  2012 K-Means算法的研究与改进 周爱武,陈宝楼,王  琰 (安徽大学计算机科学与技术学院,安徽 合肥 230039) 摘  要:K-Means算法是一种基于划分方法的经典聚类算法,已经在很多领域得到广泛的应用。 虽然该算法有很多优点, 但其也存在自身的局限性,比如需要用户输入聚类簇个数,初始聚类中心是随机性选择的,算法容易陷入局部最优解,对 孤立点比较敏感等。 文中首先应用统计学中的标准分数对样本进行孤立点分析,然后提出一种新的初始聚类中心确定策 略。 对改进的算法和原算法分别做实验进行比较,实验结果表明,改进的算法在准确率、收敛速度和稳定性方面都有很大 的提高。 关键词:K-Means算法;孤立点;初始聚类中心 中图分类号:TP301.6            文献标识码:A            文章编号:1673-629X(2012)10-0101-04 Research and Improvement of K-Means Algorithm ZHOU Ai-wu,CHEN Bao-lou,WANG Yan (College of Computer Science and Technology,Anhui University,Hefei230039,China) Abstract:K-Meansalgorithm isaclassicclusteringalgorithmbasedontheclassificationmethodhasbeenwidelyappliedinmanyfields. Although the algorithm hasmany advantages,therearealsotheir own limitations,such asuser input thenumber of clusters,initial cluster centersisrandom selection,thealgorithmiseasytofallintolocaloptimal solutionismoresensitivetooutlierandsoon.Itfirstlyanalyses sample outlierby statisticsstandardscores,andthenputsforwardanewstrategytodeterminetheinitialclusteringcenters.Improvedalgo- rithm and theoriginalalgorithmweredoingexperimentstocompare,theexperimentalresultsshowthattheimprovedalgorithmsaccuracy rate,convergence speed and stability are improved greatly. Key words:K-Means;outlier;initial clustering centers 0  引  言 迭代进行优化。 在初始聚类中心选择方面,主要有以 随着数据挖掘的应用不断发展,聚类分析已经广 下三种经典的改进算法。 文献[5]提出的一种简单聚 泛地应用到了很多领域,包括市场研究、数据分析、模 类探索方法,文献[6]给出的一种二元分裂方法,文献 式识别、图像处理、人工智能和 Web 文档分类等领 [7]给出的K值评估方法。 [1,2] 传统K-Me

文档评论(0)

sunyangbill + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档