网站大量收购独家精品文档,联系QQ:2885784924

聚类分析自学.pptx

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
聚类分析自学

聚类分析;K-均值聚类分析 K-means Cluster;基本原理 具体做法 1、按照指定的分类数目n,按某种方法选择某些观测量,设为{Z1,Z2,…Zn},作为初始聚心。 2、计算每个观测量到各个聚心的欧氏距离。即 按就近原则将每个观测量选入一个类中,然后计算各个类的中心位置,即均值,作为新的聚心。 3、使用计算出来的新聚心重新进行分类,分类完毕后继续计算各类的中心位置,作为新的聚心,如此反复操作,直到两次迭代计算的聚心之间距离的最大改变量小于初始聚类心间最小距离的倍数时,或者到达迭代次数的上限时,停止迭代。;系统聚类法 Hierarchical Cluster;一、问题提出 聚类分析——对一批样品或指标进行分类的一种统计方法。;(3)相关系数 (4)关联系数 ;二、聚类统计量;对于任意两个样品Xi和Xj的相似程度可用这两个向量之间的夹角余弦 ;如果把上述n个样品的任何两个样品的相似系数;用相似系数作为聚类统计量时的分类方法;2、分类方法;要求对此7个样品进行聚类,采用的聚类统计量是相似系数(夹角余弦); 1 2 3 4 5 6 7;;(3)记下Q中剩余元素最大值q24=0.91,划去Q中的第4行第4列 (4)记下Q中剩余元素最大值q26=0.67,划去Q中的第6行第6列 (5)记下Q中剩余元素最大值q12=0.51,划去Q中的第2行第2列 (6)记下Q中剩余元素最大值q17=0.24 ;作聚类图:;2)利用相关作聚类分析;;按矩阵R中数值对8个指标(按四个原则)进行聚类: 1)记下矩阵中的最大值;作聚类图:;两步聚类法 TwoStep Cluster;简单介绍基本原理 分两步进行 第一步:预聚类。对记录进行初始的归类,用户自定义最大类别数。通过构建和修改特征树(CT Free)完成。 第二步:正式聚类。对第一步完成的初步聚类进行再聚类并确定最终的聚类方案,系统根据一定的统计标准确定聚类的类别数目。 以后,可以通过传统的聚类方法进行聚类(SPSS中采用合并型分层聚类法)。

文档评论(0)

hhuiws1482 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档