- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
总第289期 计算机与数字工程 Vo1.41No.11
2013年第 儿期 Computer DigitalEngineering 1713
K均值算法的K值优化研究和应用
孙镇江 梁永全 樊建聪 马远坤 梁天一
(山东科技大学信息科学与工程学院 青岛 266590)
摘 要 在数据挖掘领域,K均值算法是一种经典的聚类算法,但 K值需要事先设定,并且 K均值算法的性能易受 K值的影响,随着
大数据时代的到来,用户很难准确确定K值。论文结合计算机操作系统中内存分配的循环首次适应算法和基于密度聚类的方法,以及分布
式估计算法 (EDAs)提出了基于密度的循环首次适应K值优化算法来优化K值 ,用理论验证算法的可行性 ,并运用K均值中文文本聚类验
证算法的有效性。
关键词 K均值;分布式估计 (EDAs);阈值;密度
中图分类号 TP181 DOI:10.3969/j.issn1672—9722.2013.11.001
OptimizationStudyandApplicationonK ValueofK-meansAlgorithm
SUNZhenjiang LIANGYongquan FANJiancong MAYuankun LIANGTianyi
(CollegeofInformationScienceandEngineering,ShandongUniversityofScienceandTechnology,Qingdao 266590)
Abstract TheK—meansalgorithm isaclassicalclusteringalgorithm inthefieldofdatamining.ButtheK valueneedstobesetinad—
vance,andtheperformanceofK—meansalgorithm issusceptibletotheimpactoftheK value.W iththeadventoftheeraofbigdata,theuser
isdifficulttoaccuratelydeterminetheK value.BeaimedatoptimizingtheK value,thispaperputsforwardaalgorithm namedtheDensity-
basedandNextfitoftheK valueoptimizationalgorithm ,whichcombinesthenextfitofmemoryallocationincomputeroperatingsystem and
thedensity-basedclusteringmethod,asweIlasthedistributedestimationalgorithms(EDAs).Thetheoryisusedtoverifythefeasibilityof
thealgorithm andverifytheeffectivenessofthealgorithmbyusingoftheK—meansChinesetextclustering.
KoyWords K—means,estimationofdistributionalgorithms(EDAs),threshold,density
ClassNumtmr TP181
知道真实的K值,这样,就会影响K均值算法的效果。
1 引言
本论文主要研究K均值的第2)缺点,关于第2)缺点,许多
聚类 [】]是一个把数据对象集划分成多个组或簇的过 学者已经做了大量的研究工作:BezdekJC[。]提出基于样本隶
程。随着大数据时代的到来,聚类作为一种数据挖掘工具 属度的划分概念,聚类个数K通过满足min(Jm(U,c))获得,其
已经根植于很多应用领域,如生物学、安全、商务智
您可能关注的文档
最近下载
- 人教版英语八年级上Unit3整单元课件(共190张ppt).ppt
- 茶叶加工工(高级、三级)理论考试复习题库(含答案).docx
- 数据通信基础认知—数据通信系统的基本概念.pptx
- 2024年宠物食品行业分析报告:从零食到主粮,从代工依赖到海内外均衡发展.pdf
- 床上用品供货及售后服务方案.docx VIP
- 一种双偏振雷达降水优化反演方法.pdf VIP
- 亲子农场体验园设计.pptx
- 刘京焕财政学模拟测试题.doc VIP
- 荣威-360-产品使用说明书-荣威360PLUS 1.5L 自动尊享版-CSA7154ADAC-荣威360用户手册-2018.7.11.pdf
- 财政学原理刘京焕陈志勇李景友第十章节.ppt
文档评论(0)