- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于图的聚类0102030405最小生成树聚类OPOSSUMChameleonJarvis-Patrick聚类算法基于SNN密度的聚类最小生成树聚类(minimumspanningtree,MST)计算相异度图的最小生成树01Repeat02断开对应于最大相异度的边,创建一个新的簇03Until只剩下单个簇04最小生成树聚类是一种基于分裂的层次聚类算法05最小生成树聚类可以看作用稀疏化找出簇的方法06基于图的聚类0102030405最小生成树聚类OPOSSUMChameleonJarvis-Patrick聚类算法基于SNN密度的聚类OPOSSUM:使用METIS的稀疏相似度最优划分OPOSSUM(OptimalPartitioningofSparseSimilaritiesUsingMETIS)是一种专门为诸如文档或购物篮数据等稀疏、高维数据设计的聚类技术。与MST一样,它基于邻近度图的稀疏化进行聚类。然而,OPOSSUM使用METIS算法,该算法是专门为划分图设计的。OPOSSUM聚类算法计算稀疏化的相似度图使用METIS,将相似度图划分成k个不同的分支(簇)所使用的相似性度量是适合于稀疏、高维数据的度量,如扩充的Jaccard度量或余弦度量。METIS图划分程序将稀疏图划分为k个不同的分支,其中k是用户指定的参数,旨在(1)最小化分支之间边的权值(2)实现平衡约束。OPOSSUM使用如下两种约束中的一种:(1)每个簇中的对象个数必须粗略相等,或(2)属性值的和必须粗略相等。12优点与缺点它将数据划分大小粗略相等的簇。根据聚类的目标这可能看作优点或缺点。02OPOSSUM简单、速度快。01基于图的聚类0102030405最小生成树聚类OPOSSUMChameleonJarvis-Patrick聚类算法基于SNN密度的聚类Chameleon是一种凝聚聚类技术,它解决前两段提到的问题。它将数据的初始划分与一种新颖的层次聚类方案相结合。这种层次聚类使用接近性和互连性概念以及簇的局部建模。关键思想是:仅当合并后的结果簇类似于原来的两个簇时,这两个簇才应当合并。确定合并哪些簇相对接近度(relativecloseness,RC):是被簇的内部接近度规范化的两个簇的绝对接近度。两个簇合并,仅当结果簇中的点之间的接近程度几乎与原来的每个簇一样。mi和mj分别是簇ci和cj的大小。SEC(ci,cj)是连接簇ci和cj的边的平均值;SEC(ci)是二分簇ci的边的平均权值。相对互连度(relativeinterconnectivity,RI):是被簇的内部互连度规范化的两个簇的绝对互连度。如果结果簇中的点之间的连接几乎与原来的每个簇一样强,两个簇合并。01其中,EC(Ci,Cj)是连接簇Ci和Cj的边之和;EC(Ci)是二分簇Ci的割边的最小和;EC(Cj)是二分簇Cj的割边的最小和。02RI和RC可以用多种不同的方法组合,产生自相似性的总量。Chameleon使用的方法是合并最大化RI(Ci,Cj)*RC(Ci,Cj)a簇对。其中a值大于1.03RelativeClosenessschemeswillmerge(a)and(b)Relativeinterconnectivityschemeswillmerge(c)and(d)构造k-最近邻图使用多层图划分算法划分图Repeat合并关于相对互连性和相对接近性而言,最好地保持簇的自相似性的簇Until不再有可以合并的簇算法估计数据分布:确定分布:一般假设数据取自高斯混合分布。然后,对分布的参数进行估计:利用EM算法进行最大似然估计利用直方图估计分布对分布进行划分、分离。每个分布对应于一个簇。12优点和缺点混合模型比k均值或模糊c均值更一般,因为它可以使用各种类型的分布。利用简单的估计分布的方法(如直方图)可能会错误估计数据的原始分布,导致结果不好。利用复杂的方法(如EM算法),计算复杂性会大大增加。基于原型的聚类01模糊聚类02使用混合模型的聚类03自组织映射自组织映射Kohonen自组织特征映射(SOFM或SOM)是一种基于神经网络观点的聚类和数据可视化技术。尽管SOM源于神经网络,但是它可以表示成一种基于原形的聚类的变形。与其他基于质心的聚类技术一样,SOM的目标是发现质心的集合,并将数据集中的每个对象指派到提供该对象最佳近似的质心。用神经网络的术语,每个质心都与一个神经元相关联。01
您可能关注的文档
- 授课技巧培训课程ttt培训师培训.ppt
- 微机接口ppt课件第9章AD与DA转换.ppt
- 有机化合物的结构本质及构性关系.ppt
- 我读对联识汉字每课一练.ppt
- 植物的呼吸作用.ppt
- 小学语文(新人教版)五年级下册回顾拓展七课件.ppt
- 景区规划与管理第九章景区的游客管理.ppt
- 教幼儿学汉字笔顺“九”.ppt
- 心肺复苏后脑保护策略.ppt
- 数据库技术应用基础第6章.ppt
- 2025年攀枝花市税务系统事业单位人员招聘笔试备考题库及答案解析.docx
- 2025年四川省林业系统事业单位人员招聘笔试备考题库及答案解析.docx
- 2025年攀枝花市卫生健康系统事业单位人员招聘笔试备考题库及答案解析.docx
- 2025年长春市林业系统事业单位人员招聘笔试备考题库及答案解析.docx
- 2025年湘西市税务系统事业单位人员招聘笔试备考题库及答案解析.docx
- 2025年四川省税务系统事业单位人员招聘笔试备考题库及答案解析.docx
- 2025年湘西市卫生健康系统事业单位人员招聘笔试备考题库及答案解析.docx
- 2025年长沙市林业系统事业单位人员招聘笔试备考题库及答案解析.docx
- 2025年四平市税务系统事业单位人员招聘笔试备考题库及答案解析.docx
- 2025年四平市卫生健康系统事业单位人员招聘笔试备考题库及答案解析.docx
最近下载
- (人教版2019选择性必修第三册)高中物理综合测试卷(原卷版+解析).docx VIP
- 2024年四川省德阳市中考物理试题卷(含答案).docx
- 2024年中考语文专题复习:非连续性文本阅读(含练习题及答案).docx
- 第八章《浮力》单元测试(含解析)2024-2025学年鲁科版物理八年级下学期.pdf VIP
- 铁路轨道车制动系统-研究所.ppt
- 2025年事业单位招聘考试公共基础知识专题复习讲义及训练:法律知识.pdf
- 关于创建“温馨校园”活动的实施方案.pdf
- 产后修复腹直肌护理.pptx VIP
- 辽宁协作校2024-2025学年度高三第二次模拟考英语试题(含答案).docx
- 产后康复-腹直肌分离.pptx VIP
文档评论(0)