- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
FCM聚类算法与改进层次聚类算法的结合.pdf
第 9~接第 17 期 2(阴年9 月
1671-1819(2∞9)17.5∞8-04
科学技术与工程
Science Technology and 览ngineeri吨
VoL 9 No. 17 Sep. 2(削
@ 2009 Sci. Tech. En问
FCM 聚类算法与改进层次聚类算法的结合
陈亚平呆陈
(江苏科技大学,镇江 212∞的
摘事 模糊 c- 均值果提算法(fuzzy C-means 简称 FCM)和层次聚类算法是两种非常1重要的.类算法。由于 FCM 算法对初
始聚类中心敏感,并且需要人为确定果提类别数,这样收敛结果易陷入局部最优解。通过对这两种聚类算法的分析,首先对
传统的凝聚层次廉类算法提出了改进,然后用改进的凝聚层次聚集算法得到最佳廉类数和初始聚类中心,最后用 FCM 算法进
行再次自棠,以此得到更好的聚集结果并且减少了执行时间和迭代次数。
关键词凝聚屡次聚类 模糊。均值聚樊 初始聚类中心 全链接
中罔端分樊号TP311.13j ::t献标志同 A
聚类分析是依据样本间关联的最度标准将其
自动分成几个群组,且使同一群组内的样本相似,
阳属于不同群组的样本相异的一组方法[1] 。果类
分析巳钝广泛地用在许多应用中,包括模式识别、
数据分析、回像处理,以及市场研究。通过襄樊,能
够识别密集的和稀疏的区城,因而发现全局的分布
模式,以及数据属性之间的有趣的相互关系[2] 。
模糊 c-均值骤类算法( fu町 ιmeans 简称
FCM)和层次襄樊算法是两种非常熏耍的襄樊算
挫,然而两种算法都存在着一些缺点。通过对两种
廉类算法的分析,本文将层次聚类算法与 FCM 算法
结合,先用改进的凝廉层次算法得到最佳襄樊数和
初始聚类中心,然后再用 FCM 算法进行聚棠,以此
得到更好的架类结果。
1 凝聚居次聚类算法
1.1 摄黯层次黯提算法介绍
在层次聚类分析中,不需要在输入中指定要分
成的类的个数,一个层次的襄樊方法将数据对象组
筑朋年5 月 17 日收到
第一作者简介:陈亚平(1984一) ,舅,汉族,江苏省镇江市人,硕士
研究生,研究方向:数据库应用系统。 E-mail: chenyapir明34@hot-
mail. 创棚。
成一棵聚类的树,根据层次分解是自底向上还是自
顶向下形成,层次的聚类方法可以进一步分为凝聚
的和分裂的层次聚类。
凝聚础层次廉类又称为合并型层次聚类,是一
种白鹿向上的方法。首先将每一个对象看作一个
簸,然后根据某些准则合并这些原子簇为越来越大
的簸,直到所有的对象都在一个簸中,或者某个终
结条件被满足。
算法中簇间合并准则有以下几种:
(1)单链接 :d( 叭 , C2 ) =min(d,,);
$ e C
20
(2)金链接:d( 叭 , C2 ) 窑 m皿(d,,) ;
$eC2 。
仰平均链接:机
re C
1
,$ e C20
reC
1
,
reC
1
,
(4)囊心法 :d( 叭 , Cz ) = d( 第l 那2); Xll X2 分别
为叭 , C2 的重心。
其中叭 , C2 是两个样本樊 , ?1 表示 C1 中的样
本个数,叫表示 C2 中的样本个数 , d表示叭 , Cz 之
间的距离的字母简称。本文采用全链接法计算类
问距离,在全链接算法中,两个类间的距离般每对
样本的距离中的最大值。
层次聚类方法尽管简单,但是一且一组对象被
17 期 陈]E平,等 :FCM 攘提算法与改进膳次襄樊算法的结合 5以)9
合并或分裂,就不能修正。如果在某一步没有很好
地选择合并成分裂的决定,可能会导致低质量的廉
类结果。而且,这种聚类方法不具有很好的可伸缩
性,因为合并或分裂的决定需要检查和估算大量的
对象或簸。所以通常会将股次襄樊算法与其他聚
樊算法结合,以达到更好的聚类质量。
1.2 凝黯膳次黯提篝法改进
层次聚樊算法每合并完一个提对象盾,就必须
重新计算合并后类间的距离,对于有大量数据的样
本集而亩,计算最是惊人的。假定廉类的对象有 n
个,那么按照层次襄樊算法的思想,第一次合井之
前距离矩阵大小为 nz ,当合并完一个类之后,剩下
的类数为 n -1 ,在第二次合并之前必须意新计算樊
与类之间的距离,距离组阵大小变为(n -1 沪,依次
递推,直至所有类合并为一个费为止,由此可以看
出层次聚类算黯所需的距离矩阵存储空间是 n2 阶,
而类问距离每次又要重新计算,相应计算盘为 n2
阶。对于海量数据来说,这需要路费大蠢的存储空
间和计算时间(3) 。
基于以上考虑,本文对算法做了一些改进。改
进后的凝聚居次聚樊算法描述如下:
(1)输入 n 个用于分类的样本叭,叫,…,凡,把
一个样本作为一个类,即 Ci = lx.1 (i = 1 , 2 ,…,时
您可能关注的文档
- 2000年以来人口城镇化水平变动省际差异分析——基于统计数据的校正和修补.pdf
- 26种省级农业科学期刊基金论文层次分析.pdf
- 3种裂腹鱼的形态差异研究.pdf
- 90年代国际产业竞争对日本经济的影响.pdf
- ASON中层次路由技术研究.pdf
- cDNA-AFLP比较当归早薹基因转录差异反应体系的建立.pdf
- Cetuximab联合一线和非一线化疗方案治疗16例非小细胞肺癌近期疗效及其疗效差异.pdf
- FDI溢出、吸收能力与东道国IT产业的发展.pdf
- FY-2E与FY-2C红外分裂窗通道光谱响应差异的对比分析.pdf
- Heterotopia"差异地点"还是"异托邦"——兼论福柯的空间权力思想.pdf
文档评论(0)