- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于面向对象思想KMeans算法实现
第lO卷第3期 滁州学院学报 V01.10No.3
200旧年5月 oFCH唧0UUNn咂RSrrY May.2008
JOUIINAL
基于面向对象思想KMeans算法实现
陈寿文,,: 李明东-
(1.西华师范大学计算机学院,四川南充637000;2.滁州学院数学系,安徽滁州239000)
摘要:KMe咖算法是聚类算法中的一种常用算法。在模式识别和聚类中经常被使用,属于无监督武分类的
一个分支。其主要目的是对具有相同数据类型的样本数据按距离最短规则进行集合的划分。最终获取各等价
类。在采用面向对象程序设计方法时,利用Y蛐幽n类实现各样本的相关运算,并采用IJiIll【U8t类对象来存储
各等价类中的元素,从而简化了实现的复杂度。并试图从初始化聚类中心点角度对Ⅺ吼:咖算法提出了改进。
关键词:对象;类;KMe咖算法实现
中图分类号:0121-4 文献标识码:A 文章编号:1673—1794(2008)03—0042咱3
作者简介:陈寿文(1979_),男,安徽怀宁人,西华师范大学计算机学院2007级硕士研究生潞州学院数学系.
1 KMe舭8算法简介
1.1KMea璐算法算术描述
KHeans算法是一种聚类算法,经常运用于数据挖掘和模式识别中,是一种无监督式的学习算法,其使
用的目的是对集合进行等价类的划分,即对一组具有相同数据结构的纪录按某种分类准则进行分类,以获取
若干个同类记录集田,相应的数学语言描述为:
×1-(×11,X12,…,X1n1. 【
,
结论A—fA1.A2.…,AKl中A1 为集合A,中记录的
1-1。….K的获取,其畸哇。nA膨.UA一,∑IA;I=^‘lA;I
I l I i=1
个数.
1.2l【I慨算法实现步骤描述目
Sb叩2:以cb%…,cx为参考对所有的记录)【i嘶.谭进行归类,其中归类的标准为:
If
ID(剖Il酬b.K肄.K砖.僵,一then置划分到A,中;
step3:重新计算各划分记录集合A,产1,…,k的参考中心,通常按照加权平均的方式处理,即:。
五 c≥由∑)(jEA轴
s姊)4:计算平方误差髓∑∑五EA0.≯毛‘I;
St印5:E不再改变或各A孙.‘中的成员不再改变时算法终止,否则转Step2继续.
1.3KMea璐算法改进
一42—
由于在KMeaIls算法中初始化聚类中心的时候,习惯性采用随机抽取样本数据集合中的K个样本来近似,
所以样本点抽取的不同将很大程度地影响聚类结果的获取,为此,本文采用了预处理初始聚类中心点的方法来
改进该算法.其中点】【P到集合A的最短距离定义为:】【p与集合A中任一点】【q的距离的最小值钿dn{I节气Il,∥
.最长距离则反之.具体处理过程如下:
stepl:从样本总体集合A中选择距离最长的两点】【p,】【q,构造中间集合船¨,Al_㈥,脯~.埘。;
ste母随机生成一随机数同-龃dO吲嫉类教耳),分别对~,A-进行添加r个样本,添加的策略为:从D集合
1…r;
Step3:分别计算~,A。的加权平均中心Co和C。作为聚类的初始中心;
D=D一{0,仿step2向札中添加r个样本,计算Ak的加权中心c。;
Step5:重复Step4直到k_l(.-2;
Step6:对所有样本集合A,分别以氏庐c-.《为聚类初始中心执行KMealls算法;
2算法实现
2.1l(fⅥea璐算法实现
通过观察,该算法中处理的对象分为两种,即其中之一均为同一数据类型的向量鼯Ⅸ函X西…,Xd计帕涉及到
的操作有“
您可能关注的文档
- 后靠手柄轴项目可行性研究报告(2013年发改委评审方案设计)-专家免费咨询.pdf
- 自觉锻炼身体 文档.doc
- 嵌入式开发实践光盘详细.pdf
- Excel课件-第一堂.pptx
- 最伤感的青春年华用最伤感的QQ个生签名.doc
- 随园食单读后感.doc
- 城市交通治堵的另一条思路.docx
- 建筑玻璃幕墙结构.pdf
- 高考历史文史常识类测试题.doc
- 防晒黑防晒老 今夏8款最给力防晒霜.doc
- DeepSeek培训课件入门宝典:第2册 开发实战篇 .pptx
- 全面认识全过程人民民主-2024春形势与政策课件.pptx
- 2024春形势与政策-全面认识全过程人民民主.pptx
- 2025年春季学期形势与政策第二讲-中国经济行稳致远讲稿.docx
- 2024春形势与政策-铸牢中华民族共同体意识课件.pdf
- 2024春形势与政策-走好新时代科技自立自强之路课件 (2).pptx
- 2024春形势与政策-走好新时代科技自立自强之路课件.pptx
- 形势与政策学习指导教学-整套课件.pdf
- 2023年春季形势与政策讲稿第三讲-开创高质量发展新局面.pdf
- DeepSeek培训课件-清华大学-DeepSeek模型本地部署与应用构建.pptx
最近下载
- 计量经济学导论经济学导论.pdf
- 托福阅读tpo45R-1 原文+译文+题目+答案+背景知识.pdf
- 2023-2024学年上海市松江区六年级下学期期末考试语文试卷含详解.pdf VIP
- GB50150-2016 电气装置安装工程电气设备交接试验标准.docx
- 英大泰和财产保险股份有限公司旅行社责任保险条款(2021版).docx VIP
- 2024年秋新人教版七年级上册英语全册课件(新版教材).pptx
- 初中历史思维导图.pptx
- 2025年烟花爆竹储存证考试题库.docx
- 干冰清洗机在模具行业应用.ppt
- 区发展和改革局党组书记、局长任期内经济责任审计中反映问题的整改情况报告.docx VIP
文档评论(0)