FCM聚类算法与改进层次聚类算法的结合.pdfVIP

FCM聚类算法与改进层次聚类算法的结合.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
FCM聚类算法与改进层次聚类算法的结合.pdf

第 9~接第 17 期 2(阴年9 月 1671-1819(2∞9)17.5∞8-04 科学技术与工程 Science Technology and 览ngineeri吨 VoL 9 No. 17 Sep. 2(削 @ 2009 Sci. Tech. En问 FCM 聚类算法与改进层次聚类算法的结合 陈亚平呆陈 (江苏科技大学,镇江 212∞的 摘事 模糊 c- 均值果提算法(fuzzy C-means 简称 FCM)和层次聚类算法是两种非常1重要的.类算法。由于 FCM 算法对初 始聚类中心敏感,并且需要人为确定果提类别数,这样收敛结果易陷入局部最优解。通过对这两种聚类算法的分析,首先对 传统的凝聚层次廉类算法提出了改进,然后用改进的凝聚层次聚集算法得到最佳廉类数和初始聚类中心,最后用 FCM 算法进 行再次自棠,以此得到更好的聚集结果并且减少了执行时间和迭代次数。 关键词凝聚屡次聚类 模糊。均值聚樊 初始聚类中心 全链接 中罔端分樊号TP311.13j ::t献标志同 A 聚类分析是依据样本间关联的最度标准将其 自动分成几个群组,且使同一群组内的样本相似, 阳属于不同群组的样本相异的一组方法[1] 。果类 分析巳钝广泛地用在许多应用中,包括模式识别、 数据分析、回像处理,以及市场研究。通过襄樊,能 够识别密集的和稀疏的区城,因而发现全局的分布 模式,以及数据属性之间的有趣的相互关系[2] 。 模糊 c-均值骤类算法( fu町 ιmeans 简称 FCM)和层次襄樊算法是两种非常熏耍的襄樊算 挫,然而两种算法都存在着一些缺点。通过对两种 廉类算法的分析,本文将层次聚类算法与 FCM 算法 结合,先用改进的凝廉层次算法得到最佳襄樊数和 初始聚类中心,然后再用 FCM 算法进行聚棠,以此 得到更好的架类结果。 1 凝聚居次聚类算法 1.1 摄黯层次黯提算法介绍 在层次聚类分析中,不需要在输入中指定要分 成的类的个数,一个层次的襄樊方法将数据对象组 筑朋年5 月 17 日收到 第一作者简介:陈亚平(1984一) ,舅,汉族,江苏省镇江市人,硕士 研究生,研究方向:数据库应用系统。 E-mail: chenyapir明34@hot- mail. 创棚。 成一棵聚类的树,根据层次分解是自底向上还是自 顶向下形成,层次的聚类方法可以进一步分为凝聚 的和分裂的层次聚类。 凝聚础层次廉类又称为合并型层次聚类,是一 种白鹿向上的方法。首先将每一个对象看作一个 簸,然后根据某些准则合并这些原子簇为越来越大 的簸,直到所有的对象都在一个簸中,或者某个终 结条件被满足。 算法中簇间合并准则有以下几种: (1)单链接 :d( 叭 , C2 ) =min(d,,); $ e C 20 (2)金链接:d( 叭 , C2 ) 窑 m皿(d,,) ; $eC2 。 仰平均链接:机 re C 1 ,$ e C20 reC 1 , reC 1 , (4)囊心法 :d( 叭 , Cz ) = d( 第l 那2); Xll X2 分别 为叭 , C2 的重心。 其中叭 , C2 是两个样本樊 , ?1 表示 C1 中的样 本个数,叫表示 C2 中的样本个数 , d表示叭 , Cz 之 间的距离的字母简称。本文采用全链接法计算类 问距离,在全链接算法中,两个类间的距离般每对 样本的距离中的最大值。 层次聚类方法尽管简单,但是一且一组对象被 17 期 陈]E平,等 :FCM 攘提算法与改进膳次襄樊算法的结合 5以)9 合并或分裂,就不能修正。如果在某一步没有很好 地选择合并成分裂的决定,可能会导致低质量的廉 类结果。而且,这种聚类方法不具有很好的可伸缩 性,因为合并或分裂的决定需要检查和估算大量的 对象或簸。所以通常会将股次襄樊算法与其他聚 樊算法结合,以达到更好的聚类质量。 1.2 凝黯膳次黯提篝法改进 层次聚樊算法每合并完一个提对象盾,就必须 重新计算合并后类间的距离,对于有大量数据的样 本集而亩,计算最是惊人的。假定廉类的对象有 n 个,那么按照层次襄樊算法的思想,第一次合井之 前距离矩阵大小为 nz ,当合并完一个类之后,剩下 的类数为 n -1 ,在第二次合并之前必须意新计算樊 与类之间的距离,距离组阵大小变为(n -1 沪,依次 递推,直至所有类合并为一个费为止,由此可以看 出层次聚类算黯所需的距离矩阵存储空间是 n2 阶, 而类问距离每次又要重新计算,相应计算盘为 n2 阶。对于海量数据来说,这需要路费大蠢的存储空 间和计算时间(3) 。 基于以上考虑,本文对算法做了一些改进。改 进后的凝聚居次聚樊算法描述如下: (1)输入 n 个用于分类的样本叭,叫,…,凡,把 一个样本作为一个类,即 Ci = lx.1 (i = 1 , 2 ,…,时

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档