K均值算法的K值优化研究和应用.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
总第289期 计算机与数字工程 Vo1.41No.11 2013年第 儿期 Computer DigitalEngineering 1713 K均值算法的K值优化研究和应用 孙镇江 梁永全 樊建聪 马远坤 梁天一 (山东科技大学信息科学与工程学院 青岛 266590) 摘 要 在数据挖掘领域,K均值算法是一种经典的聚类算法,但 K值需要事先设定,并且 K均值算法的性能易受 K值的影响,随着 大数据时代的到来,用户很难准确确定K值。论文结合计算机操作系统中内存分配的循环首次适应算法和基于密度聚类的方法,以及分布 式估计算法 (EDAs)提出了基于密度的循环首次适应K值优化算法来优化K值 ,用理论验证算法的可行性 ,并运用K均值中文文本聚类验 证算法的有效性。 关键词 K均值;分布式估计 (EDAs);阈值;密度 中图分类号 TP181 DOI:10.3969/j.issn1672—9722.2013.11.001 OptimizationStudyandApplicationonK ValueofK-meansAlgorithm SUNZhenjiang LIANGYongquan FANJiancong MAYuankun LIANGTianyi (CollegeofInformationScienceandEngineering,ShandongUniversityofScienceandTechnology,Qingdao 266590) Abstract TheK—meansalgorithm isaclassicalclusteringalgorithm inthefieldofdatamining.ButtheK valueneedstobesetinad— vance,andtheperformanceofK—meansalgorithm issusceptibletotheimpactoftheK value.W iththeadventoftheeraofbigdata,theuser isdifficulttoaccuratelydeterminetheK value.BeaimedatoptimizingtheK value,thispaperputsforwardaalgorithm namedtheDensity- basedandNextfitoftheK valueoptimizationalgorithm ,whichcombinesthenextfitofmemoryallocationincomputeroperatingsystem and thedensity-basedclusteringmethod,asweIlasthedistributedestimationalgorithms(EDAs).Thetheoryisusedtoverifythefeasibilityof thealgorithm andverifytheeffectivenessofthealgorithmbyusingoftheK—meansChinesetextclustering. KoyWords K—means,estimationofdistributionalgorithms(EDAs),threshold,density ClassNumtmr TP181 知道真实的K值,这样,就会影响K均值算法的效果。 1 引言 本论文主要研究K均值的第2)缺点,关于第2)缺点,许多 聚类 [】]是一个把数据对象集划分成多个组或簇的过 学者已经做了大量的研究工作:BezdekJC[。]提出基于样本隶 程。随着大数据时代的到来,聚类作为一种数据挖掘工具 属度的划分概念,聚类个数K通过满足min(Jm(U,c))获得,其 已经根植于很多应用领域,如生物学、安全、商务智

文档评论(0)

lizhencai0920 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6100124015000001

1亿VIP精品文档

相关文档